You are now offline.

不甘於Google收購後的安逸,Atmanity如何讓「AI虛擬人」擁有靈魂?

不甘於Google收購後的安逸,Atmanity如何讓「AI虛擬人」擁有靈魂?
atmanity
分享
收藏
已完成
已取消

「The lights are on, but no one's home.(燈是亮著的,但家裡沒人。)」

這是Atmanity創辦人余正平在觀察了市面上絕大多數的AI虛擬人(Avatar)後,得出的最深刻、也最為諷刺的結論。一個根本性的問題始終懸而未決:我們為何無法與AI建立真實的連結?

為了解決這個難題,Atmanity的解決方案是一個即將上線的No-Code Creator Studio(無代碼創作者平台)。「我們的工具可以讓個人創作者、公司,甚至是任何人,去打造他們自己的數位分身。」余正平解釋道。用戶只需連上網站,透過與Atmanity的引導AI進行一段互動對話,平台就會在過程中即時捕捉,並錄製下使用者的個性與行為模式,並以此生成一個極度擬真的互動式數位分身。

為了快速驗證市場,Atmanity的初期策略是從最能引發共鳴的「名人IP」切入。在其官網的Demo中,已能看到與撲克傳奇Phil Hellmuth等名人的合作案例。「為什麼先找名人?因為大家認識他們,有熟悉感。」余正平說,「當你看到一個AI分身不只是『像人』,而是『像蔡依林』時,你才會產生強烈的互動慾望。」

這不是余正平第一次創業,先前他創辦的第一家公司Phiar是AR導航新創,在2022年成功被Google收購,對許多創業者而言,這已是夢想的終點。但在Google內部,余正平反而更清晰地看見了下一個浪潮的起點。而最終促使他再次投身創業洪流的,是那份對自由的渴望與更大的野心。

挑戰1秒生成30幀畫面:Atmanity解密AI分身「靈魂」的兩大關鍵

要讓AI分身擁有靈魂,Atmanity必須攻克兩大業界難題。

第一個,就是讓AI Avatar可以即時互動。余正平指出,像是Sora 2或Google的V0.3等工具,雖然能生成逼真影片,但速度極慢,「你要生成一段30秒的影片,可能就要花好幾個小時。」這種延遲,根本不可能應用在即時對話上,一個流暢的互動體驗,至少需要達到每秒30幀(frame)的生成速度。因此,實現即時生成是至關重要的第一道關卡。

第二個挑戰,是如何讓AI Avatar看起來不要那麼僵硬、像個假人。「其實Avatar這個概念並不新,遊戲裡的NPC也可以互動,那是預設好的腳本。」他說,「所以你知道那跟真人的差距還是很大,那種互動感還是偏假、不自然。」

余正平解釋,真正的挑戰,還是如何用生成式AI,即時產出符合當下情境的表情、動作與行為,這也是Atmanity最核心的技術突破,那就是重新定義真實感。

過去業界普遍認為,讓AI擬真的關鍵是模擬情緒,如喜怒哀樂。但Atmanity團隊很快發現這是一條錯誤的路。「我們平常對話時,90%的時間都處於中性情緒,但你依然覺得我是真人。為什麼?」余正平指出,「關鍵不在Emotion(情緒),而在於Expression(表達)和Behavior(行為)。」

每個人的挑眉、點頭、語氣停頓,這些獨一無二的個人習性,才是構成「你之所以是你」的關鍵。因此,他們開發出一套獨特的行為模型,將一個人的行為拆解為兩大類。

  1. 對話行為(Conversational Behavior):包含說話的語速、節奏、停頓習慣,甚至是打斷別人或附和的時機。
  2. 肢體行為(Physical Behavior):如臉部微表情、點頭、挑眉等慣性動作。

透過深度學習,Atmanity的模型能精準捕捉並複製這些細微的個人特質,不僅能複製一個人的長相,更能捕捉其對話節奏與身體語言。用戶在與他們授權的網紅Demo互動時,會發現,AI會在對話的間隙,做出真人般的點頭、附和,甚至在你說話過長時,會適時地說出「OK」、「Yeah」、「Right」來回應,這正是Atmanity打破傳統「一問一答」機器感,實現即時對話的獨家技術。

目前,團隊的收費模式將採訂閱制,類似電信資費。用戶可根據需求購買不同等級的方案,獲得相應的AI互動分鐘數。初期的市場切入點,將瞄準KOL與品牌娛樂產業。余正平解釋:「為什麼先找名人?因為大家認識他們,有熟悉感。當你看到一個AI分身不只是『像人』,而是『像蔡依林』時,你才會產生強烈的互動慾望。」

對於創作者擔心被AI取代的憂慮,余正平則認為這是一種賦能而非取代,「你的AI分身受歡迎,正是因為你本人受歡迎。你必須持續經營個人品牌,AI才能放大你的價值,甚至在你休息時,幫你創造收入。」

二次創業的反思:從Google出走,他如何用「治癌藥」哲學打造技術護城河?

對余正平而言,創辦Atmanity不僅是再次投身AI浪潮,更是對前一次創業經驗與Google大公司文化的一次深刻反思。

他創辦的第一間公司Phiar,從成立到被Google收購耗時5年。他說:「這次我們很確定,產品的驗證與發布必須在一年內完成。」這種思維轉變,也體現在他對護城河的重新定義上。而促使他離開Google的最後一根稻草,是對自由的渴望與更大的野心,「我們就是不適合在大公司工作的人,像小螺絲一樣沒有自由。」

在探索創業題目時,他和共同創辦人蔡易軒看到市面上做AI分身的先行者雖已能生成AI影片,卻存在兩個致命缺陷。「我們那時有了兩個頓悟。」余正平回憶,「第一,這些Avatar你只能看,不能跟它對話;第二,就算畫質再高,看起來還是非常僵硬,臉上沒有表情,就像『皮笑肉不笑』。」

Atmanity
圖片由左至右的三位核心成員分別為: Head of Engineering, Jim Zin、執行長余正平(右前)、共同創辦人蔡易軒(右後) Atmanity

正是「缺乏互動」與「沒有靈魂」的兩大痛點,讓他更清晰地看見了下一個浪潮的起點:打造一個真正能即時互動、擁有真實靈魂的數位分身。

然而,在AI新創圈,「快速推出應用、驗證市場需求」幾乎是奉為圭臬的YC(Y Combinator)顯學。余正平卻選擇了一條有些不同的路。「現在大部分AI新創都在做『應用層』,好處是能快速推出產品測試市場,如果不行就馬上換下一個,迭代速度非常快。」他分析道,「但這種模式的缺點也十分明顯:技術門檻低,導致產品的差異化和防禦性都非常薄弱。」

因此,本身就是AI研究員出身的他決定反其道而行。「我們背景都是AI研究,我們希望抓住這波生成式AI的浪潮,但不是做純應用層。」余正平表示,「我們想挑戰一個有足夠技術門檻、一旦做出來,就無需懷疑市場需求的題目。」

他用了一個絕佳的比喻來解釋這種策略:「我們就像在研發一種能治癒癌症的特效藥。你根本不需要去驗證這款藥有沒有市場需求(Product-Market Fit),因為只要你做得出來,市場就在那裡。唯一的挑戰是,你到底做不做得到?」

這個信心的來源,是基於余正平一個簡單的觀察。「你看,在很多科幻電影裡,其實都已經出現這樣的場景了——有一個AI分身,以擬真的人形出現,跟你對話、說話。」余正平解釋,「所以我們覺得這個東西的應用場景真的太多了,潛力非常大。只要真的能做出一個看起來像真人、而且可以互動的AI,那應該就不太需要擔心PMF的問題。」

「我們的問題不是『人們要不要?』,而是『我們能把它實現到多好?』」余正平強調,真正的護城河,還是要回歸到技術的突破之上,快速建立產品生態與市場慣性。正是這種思維,讓Atmanity甘願投入所有資源專注於攻克最根本的技術難題。

因此,儘管產品尚未正式上線,Atmanity透過與撲克傳奇Phil Hellmuth等多位已有數十萬名追隨者名人的早期合作,已成功驗證市場潛力。余正平透露,自Demo發布後,已收到大量合作詢問,應用場景從粉絲互動,延伸至可成為永不休息的品牌代言人、網站上的AI客服。他認為Atmanity的對話行為模型,能有效解決傳統AI客服常被詬病的時機不對、頻繁打斷用戶等問題。

如今,這家由台灣創辦人主導的矽谷新星,正挾著對過去經驗的深刻反思,賭上一個更宏大的未來,而這個能模擬人類、潛力無窮的AI互動技術,正是他實現更大願景的入場券。

延伸閱讀
本文作者 賴冠伶 創業小聚採訪編輯 賴冠伶

遊走在人文與科技之間,雖然是個J人,但卻熱愛各種跳出框架、叛逆的人事物。2011年起《數位時代》開始以Meet社群品牌推動創業家們的交流連結。從新創團隊的採訪報導、創業小聚月會的分享、產業沙龍的分享, 提供創新與創業社群相互分享與媒合的平台。 新創團隊採訪請來信:lauren.lai@bnext.com.tw

使用會員功能前,請先登入

  • 收藏文章
了解更多關於創業小聚的資訊,歡迎透過以下服務: