「敏熙」身穿單色西裝外套,在主播台上播報國際氣象。有著姣好面容的她,說起話來內斂平穩全無遲滯,播報間隙不時溫柔微笑,甫出道便擄獲無數觀眾的心。
只是,敏熙並非真人,而是由人工智慧生成的虛擬主播。
敏熙,是由民視、光禾感知科技與台灣微軟合作推出的AI主播,也是全台首創。這款人工智慧生成的主播看似橫空出世,但其實是技術厚積而薄發的最佳例證。
成立於2017年,光禾感知科技(下稱光禾)專攻影像技術,從3D與XR起家,提供實體展場虛擬導覽、舉辦線上展會等方案;近兩年搭上元宇宙潮流,曾和幣託與全家合作搭建元宇宙平台。
因為影像是公司經營主力,光禾自然沒有錯過AIGC(AI Generated Content,人工智慧生成內容)浪潮。
去年10月,ChatGPT還沒吞噬世界、Midjourney產圖尚未驚豔世人,光禾技術團隊便「出於好玩」,參考前沿期刊論文,自行訓練AI模型生成影像。隨後在個人臉書頁面上傳影片,畫面中分明是馬斯克(Elon Musk),張嘴卻發出王友光的聲音。
並非橫空出世,背後有技術積累
同時,光禾早在AI主播推出前,就和民視結緣。「我們和民視5、6年以來,都有持續交流技術,」
光禾創辦人暨執行長王友光解釋,雙方曾合作運動會擴增實境開場秀,平時就會互通消息。
「沒想過後面會有商務機會,因為新技術最難的,就是對於落地場景的想像力。」當時出於炫耀心情向好友展示生成影像,民視伙伴看到後,決定與光禾合作,這就是開發出AI主播的契機。
不過,對電視媒體來說,主播就是新聞節目的柱石,觀眾不僅要求主播的外型、口才、臨機應變能力,更有各自偏好的主持風格。將生成式AI應用在開發虛擬主播上,難道不怕撼動產業根基?
民視新聞傳播群副總經理胡婉玲解釋,運用生成式AI,其實就像導入電腦、推行無紙化、納入現場即時連線一樣,新聞就是要不斷創新,這是產業本質。
去年生成式AI應用勃發,胡婉玲向同仁許下心願,希望利用這項技術,讓科技輔佐新聞。視覺創意中心接下挑戰,之後便找到光禾,兩者都有興趣合作下結緣。
訓練前先挑臉孔,再不斷餵養模型
觀察YouTube上AI主播播報氣象影音的留言,民眾多半提到兩個重點:聲音與影像的契合度,以及主播外型。
「人類要做臉孔分析還比較難,主要仰賴經驗法則,可是AI不是跟你來這套,它會利用這些影像,生成出受歡迎的模樣。」
王友光解釋,光禾在生成主播臉孔之前,先搜集主播、明星與藝人照片,挑選依據包含長相好看、受歡迎、很有鏡頭緣等,接著再拿上述素材為原料,以擴散模型(Diffusion Model)為技術基底,訓練出能夠生成動態圖像的模型。
光禾生成出好幾位AI主播候選人後,王友光帶隊到民視技術演示。
胡婉玲回憶,「平常我要負責培訓主播,看到(敏熙)憑直覺想,她滿不錯的。」包含民視董事長、總經理與主管群都一齊出席會議,光禾讓不同主播輪番上陣播報新聞,現場意見和胡婉玲想法相同,一致挑出現在的敏熙。
AI主播初問世,觀眾會發現嘴巴開闔和聲音無法對上,但隨著時間過去,兩者配合益發精準,甚至和真人有相似的微幅身體擺動,不會定著在台上。王友光指出,光禾持續在訓練新模型,「每個月都是以6位數的訓練小時數在計算,」不斷「燃燒」GPU,才會進步。
市面上影像資料集中的語言多半是英文,中文資料則多半來自對岸。民視有新聞播報、訪談節目,又涵蓋台語、客語、英文等豐富語種,王友光強調,這是極度珍貴的資源,「可以做的題目實在太多。」
他舉例,其他客戶不像民視有4k影像,可能只有480p的「原料」,需要透過AI提升畫質;又還有局部放大、2D轉3D等課題,他們不會僅因「對上嘴形」而滿足。
不過,當新科技在舊環境中碰撞,可能傷害既有從業人員。針對屢次被提起的「AI取代真人」討論,胡婉玲表示,AI主播的優點在於精準,能夠一絲不苟地傳達訊息,但缺點是判斷力不足,無法辨識新聞價值。
「主播有想要跟AI做得不一樣,呈現更有價值、更有思想的新聞。」她認為敏熙帶給主播同仁正面刺激,未來會調整敏熙工作範圍,例如讓她加入報時行列,但不會讓她取代真人主播。
王友光同樣認為,相較於AI主播,真人主播能夠提供反應與評論、展現情緒,甚至在播報中加入想法,帶給閱聽眾單純讀稿以外更多價值。
不是又一次泡沫,商務應用可能性大
對光禾來說,這次AI主播有如技術火力展示,未來有更多商務運用的可能性。
王友光分享,有組織創辦人過世,或者安寧病房的病患家屬,想永續留下所愛之人的影像與聲音,利用AIGC打造出虛擬分身,這種「哀悼科技」(Grief Tech),就是一種應用場景。
另外,有客戶需要在短時間產製大量多語種的宣傳影片,為此找上光禾。客戶可以提供聲音,由光禾配適生成對應嘴形的影片;或者對方提供企業主或代言人照片,生成出講述行銷內容的影像。
從元宇宙到AIGC,王友光認為光禾一直在同樣的賽道上奔跑。「我們從世界觀、架構、環境做起,AIGC讓速度更快、內容更為豐富。」
展望未來,他相信虛擬世界連接彼此的趨勢,已經無法抵擋。《一級玩家》與《第二人生》的場景,將會成為日常。
「我覺得AIGC,一定會朝向人際之間發展。因為人生下來,就會想與其他人連結。」王友光的語氣堅定無比。
《光禾感知科技》
成立:2017年
創辦人暨執行長:王友光
公司規模:50名員工
資本額:1.7億
營收:近1億
損益:目前仍處於虧損,預計今年或明年轉虧為盈
本文授權轉載自《遠見》,作者:曾子軒,原文標題:民視AI主播幕後推手、光禾感知怎麼做?

《遠見雜誌》於 1986 年創刊,近 14 年來共榮獲 75 項國內外新聞獎項。以「傳播進步觀念」為己任,為讀者洞察趨勢,探索未來方向。透過嚴謹專業精神和流暢生動的文字,致力於普及國際知識,提升進取的世界觀。