Header Ads

Google Ads廣告投放與分析課程

探討生成式AI (AIGC) 在文字、圖像與影音創作的革命性應用

探討生成式AI在文字、圖像與影音創作的革命性應用

探討生成式AI (AIGC) 在文字、圖像與影音創作的革命性應用


前言

人工智慧技術正迅速地改變我們工作和生活,尤其大型語言模型更以其多樣性和靈活性受到業界的廣泛關注。其中,ChatGPT 的出現更開創生成式 AI 的新篇章,催生了人工智慧領域的快速發展。

但 ChatGPT 帶來的廣泛價值背後,也伴隨著社會對生成式 AI (AIGC)的種種疑慮和問題,例如資料可信度、數據隱私安全、內容濫用風險以及學術倫理等問題層出不窮,未來仍需要制定相關規範並尋求合適的解決方案。

然而,「未來已至」,無論是國家、企業還是個人,都需要有遠見,積極迎接 AIGC 時代的來臨。本文將分享有關AIGC的產業應用和未來發展,期許在這一波嶄新浪潮中,大家都能抓住轉型的機會,持續推動產業發展與創新。


AIGC的「危」與「機」

美國奧克蘭藝術博物館內有一幅油畫名作,叫做《達摩克利斯之劍》,其靈感來源於一則古希臘的傳說。

圖片來源:維基百科
圖片來源:維基百科

傳說源自於古希臘的西西里島,講述當地的國王狄奧尼修斯二世,他掌握著西西里最富裕的城市,居住在華麗的宮殿中並且擁有無數珍貴的寶物。

狄奧尼修斯二世底下有一位名為達摩克利斯的官員,經常奉承他說道:「您擁有無上的權力與威望,您是世界上最幸運的人!您擁有人們夢寐以求的一切,必定也是這個世界上最幸福的人。」

其實,狄奧尼修斯二世非常厭倦這種虛偽的奉承,有一天他突然對達摩克利斯說:「你真的認為我比別人更幸福嗎?不如我與你交換身份一天,你來當國王,我來當官員。」這樣達摩克利斯就可以體驗看看當一名國王的滋味。

達摩克利斯頭戴王冠,身披國王的王袍,坐於滿佈美食的宴會桌旁。四周充滿了鮮花、美酒和美妙的音樂,每一位服侍他的僕人都謹慎有禮。他覺得自己成為了世界上最幸福的人。

但當他即將舉杯喝酒時,卻赫然發現頭頂上懸掛著一把鋒利的劍,這把劍的尖端幾乎緊貼著他的頭顱。達摩克利斯頓時嚇呆了,臉色蒼白且全身發抖,喪失了一切的食慾與快樂,唯一的願望便是逃離這宮殿,越遠越好。而這震撼的一幕,正是《達摩克利斯之劍》所描繪的場景。

面對達摩克利斯的反應,狄奧尼修斯二世問他:「這把可能隨時墜落的劍,讓你害怕了嗎?我每天都得忍受它懸掛於我的頭上。你不知道,任何時刻都可能有人會切斷那條細線,也許今天有大臣垂涎權利而企圖謀殺我,或是明天鄰國的國王會入侵我們國家,企圖篡奪王位;或者我做出的某個錯誤決定進而將我推向失敗。如果你想要成為統治者,你就得勇於承受這些風險,因為風險永遠伴隨著權力。」

達摩克利斯終於了解了國王所面臨的恐懼與壓力,他回答道:「現在我明白了,除了財富和權利,您還背負著沉重的憂慮和恐懼。請回到您的王位上吧,我願意回到我的平凡生活。」從此,達摩克利斯不再妄想國王的生活。

如今,《達摩克利斯之劍》成為了形容那些隱伏的危機和必須保持警惕的形勢的代名詞。當我們將這個典故應用在人工智慧的發展與未來時,也代表著當人類擁有強大科技的同時,也伴隨著巨大的風險和不確定性。

在人工智慧領域,AIGC的出現可以說是人工智慧發展的一個重大突破,具有前所未有的創新潛力。然而,AIGC的發展也如同懸掛頭頂的達摩克利斯之劍,帶來了巨大的不確定性和風險。一方面,它有可能推動人類社會進入一個全新的時代,不僅能夠解決許多當前無法解決的問題,還能夠開創出未來人類生活的全新可能性。然而,另一方面,AIGC也可能帶來前所未有的危機,例如,對人類就業的影響、隱私問題以及是否可能超越人類,甚至取代人類。

這種巨大的風險和不確定性,使得我們在追求AIGC的發展的同時,必須要深思熟慮,全面評估其可能帶來的影響。必須建立完善的倫理和法律架構,以確保 AIGC 的發展能夠符合人類的價值觀和利益,避免可能的風險和危機。

因此,我們必須在追求科技創新的同時,加強對這把劍的控制和管理,以確保人工智慧能夠為人類帶來福祉,而不是災難。

AIGC的產業鏈分析

AIGC主要是透過人工智慧技術運用既有的資料與數據,自動生成不同的內容,包含文案、圖片、音樂、影片…等。最大的優勢在於能夠突破人力創作的限制,最大程度地降低創作門檻以及釋放內容生產力。因此在AIGC工具的協助下,任何人都可以成為創作者,通過輸入適當的指令跟 AI 進行溝通,由AI自動生成內容。

我們可以將整個AIGC視為上游、中游、下游的產業鏈(筆者自分,以利讀者較好理解)。

AIGC產業鏈上游為技術層,主要包含自然語言處理 (NLP)、演算法、語音識別、情感分析、聊天機器人等;中游為內容層,主要透過各種AIGC工具,生成文字、圖片、音樂、影片…等內容,按照內容格式的不同,AIGC目前大致可分為文字創作 (自動文章生成)、圖像創作 (文字生成圖像)、音樂創作 (文字生成音樂)、影片生成 (文字生成影片)、虛擬人像 (圖像生成影片);下游層為應用層,各產業運用上游技術層與中游內容層進行商務經營或變現,目前廣泛應用的產業包含電商零售、金融體系、社群經營、教育培訓、工業製造、醫療產業。


AIGC產業鏈


圖像創作 – 讓 AI 幫你畫出腦海中的畫面

透過輸入文字描述,讓 AI 根據文字內容自動生成圖像作品,目前在新聞媒體、電商平台、個人創作都被廣泛使用,雖然大幅降低了數位繪畫創作的門檻,但目前仍有潛在的版權糾紛風險,但多數情境應在未來可被解決甚至商用化。


AIGC圖像生成工具隨著技術熱度提升已經百花齊放,目前市場上比較主流的 AIGC 圖像生成工具包含像是Midjourney、Stable Diffusion、Bing Image Creator,建議可以先從Bing Image Creator 練習使用,每天都有提供免費額度,只要有微軟帳號就可以免費登入使用。

以下為運用Bing Image Creator創作「楓橋夜泊」的圖片,輸入Prompt 指令:「一艘古船在寧靜的河中靜靜地停泊,四周是翠綠的楓樹,其葉隨風飄散。遠處有一座古寺,微微透出點點燈火,天空中月亮高掛,寺廟的鐘聲在夜空中迴響。」就可快速獲得 AI 創作的圖片。


文字創作 –讓 AI 幫你生成內容

AIGC 生成文字工具主要應用於文案撰寫、內容創作及文章風格改寫,使用者可以輸入一段對於目標文章的描述或需求,AI 將會自動從資料庫抓取數據並根據指令進行內容創作。

市場上目前的霸主就是 ChatGPT ,但為什麼 ChatGPT 會這麼火熱?答案很簡單,因為 ChatGPT 的出現實現了 AI 平民化!不到 2 個月的時間全球就突破 1 億使用人數,要知道連 Tiktok 至少也花了 9 個月的時間、Instagram 更是花了 30 個月才達到 1 億使用人數。

但什麼是 ChatGPT 呢? ChatGPT 是由 OpenAI 所開發的一種人工智慧技術的對話系統。其核心是一種語言模型,稱為 GPT (Generative Pre-trained Transformer)。這種模型是通過大量的數據訓練而成,能夠理解自然語言的結構和語義,進而生成自然流暢的語言。



因此,當你與 ChatGPT 進行對話時,它會根據你輸入的文字描述生成回應內容。ChatGPT可以通過使用過去的語言和對話歷史,來預測下一個可能的語言表達方式,從而生成回應內容。它使用的訓練數據可以包含許多不同主題的語言和對話,從而使ChatGPT能夠回答各種問題,從日常對話到技術問題,幫助你做出決策和提供資訊。

目前 ChatGPT 常常被使用於提高工作效率、寫作與創意、生活用途、知識學習、外語學習、履歷健診、程式開發、資料彙整、行銷應用…等。




虛擬人像 – 讓 AI 為你扮演任何角色

如果想做影片但不想露臉怎麼辦?現在靠AI就能生成一個虛擬人像,讓你不用露臉就能製作各種影片。

市場上目前較親民的 AIGC 虛擬人像工具,可以使用 HeyGen 或 D-DI 等工具,主打的就是可將人物照片轉換為動態影片或提供大量模板選擇,讓使用者可以直接搜尋使用情境進行使用。
以 HeyGen 為例,系統提供超過百種的虛擬人像模板,且提供多種語言配音,只要輸入文字就能讓 AI 主播念旁白,只需要幾分鐘就做出一支 AI 虛擬人像影片。


音樂創作 – 讓 AI 擔任你的作曲家

AIGC當然也能應用於藝術領域,其中也包含音樂創作,它可以影響音樂製作過程,包括音樂生成、音訊處理和音樂串流。有些工具甚至可以套用全世界知名作曲家的風格來創作音樂,有些較先進的 AIGC 工具甚至可以使用演算法來生成全新的歌曲。

市場上有一款知名的AIGC音樂工具「AIVA」,全名為「Artificial Intelligence Virtual Artist」,也就是人工智慧虛擬藝術家。

AIVA的CEO Pierre Barreau在 2016 年設計 AIVA 的目標,主要希望能提供作曲家創作靈感輔助工具的AI作曲系統,AIVA 也提供多種音樂編輯功能,不僅能夠創造獨特的音樂風格,更可以調整樂曲速度和音色,以獲得更多音樂變化。



影片生成 – 讓 AI 擔任你的影片剪輯大師

AIGC除了能個繪圖、寫作之外,影片當然也可使用AI創作,只要輸入文稿便能一鍵生成影片,讓系統幫忙自動剪輯、配音甚至是上字幕。目前AI生成影片適用於許多不同領域,例如廣告、教育和社群媒體等。

網路上有許多工具,包含剪映、FlexClip、Fliki…等,其中以剪映最適合一般人上手。剪映是一款免費的影片剪輯軟體,可在 Mac 和 Windows 或手機上使用。功能非常齊全,包含影片剪輯、自動上字幕、數百種特效、變音、變速、濾鏡等功能。而且剪映輸出的影片沒有浮水印,加上可以輸出 1080p 影片,電腦規格需求也不用特別高就可使用,廣受網友們推薦。


結語

狄更斯在《雙城記》中寫到:「這是最好的時代,也是最壞的時代」。我們無法選擇所處的時代,但在每個時代,總會有人致力於學習新知與新技術,成為該時代的佼佼者。他們努力掌握知識,尋求突破,最終成為時代的典範。

現在,AIGC的時代崛起,對於我們來說,更是要努力學習與思考如何靈活運用 AIGC 解決各種工作和業務問題。

只有精準運用這些工具,我們才能提高工作效率並創造出全新的商業模式。展望未來,我們有理由相信,ChatGPT 和相似的 AIGC 工具將在各個領域中發揮越來越重要的作用。對企業和個人而言,現在正是開始探索和應用這些先進技術的最佳時機。

透過持續學習與實踐,我們可以攫取這個時代的機遇,成為與時代共舞的英雄,引領著未來的發展方向。
技術提供:Blogger.