You are now offline.

AI的殺手級應用在穿戴式裝置上!心元資本鄭博仁:2大趨勢推動AI民主化

鄭博仁
鄭博仁 2023-11-06
feature picture
shutterstock
分享
收藏
已完成
已取消

2023年只剩2個月,而今年最令許多工作者「有感」的改變,想必是ChatGPT的出現,以及各種雨後春筍般出現的AI工具。對許多人來說,這一年,更像是一部突然走進現實生活的科幻電影:原本存在銀幕中的AI,以令人驚喜又害怕的腳步,來到了手機上、電腦前,成為我們的私人家教、助理、翻譯、設計師,甚至是分憂解難的知心密友。

AI軟體應用既已成趨勢,身為投資人,更進一步問的是:下一個殺手級的消費性裝置在哪裡? 接下來,AI是否能突破手機與電腦的框架,變出更多的可能性?一起來看看吧!

AI正在經歷「iPhone時刻」嗎?

2007年iPhone初問世,開啟了智慧型手機的時代,自此改變人們的生活進入以行動為優先的新紀元。而如今,AI也在經歷相同的時刻嗎?智慧型手機將會被取代嗎?哪一種裝置將成為可能的「iPhone終結者」?

這一題的答案,從近期科技公司紛紛嘗試的AI穿戴裝置來看,或許可略見端倪。

丟掉手機,在胸前戴上個人AI助理

例如,由蘋果(Apple Inc)前設計師Imran Chaudhr成立的新創公司Humane,在近期發表了穿戴裝置AI Pin。把這個小小的裝置別在胸前,就如同攜帶一高度個人化的私人AI助理,可以接聽來電、彙整行程、電子郵件,也可以拍照、錄影,更能以模仿用戶的聲音說出外國語言。

Humane創辦人Imran Chaudhri在2023 TED年度大會上展示了AI雷射投影產品
記者Zarif Ali個人Twitter

若將相機對準食物,AI助理則可以辨識其營養價值。而不像智慧型手機,AI Pin不需要螢幕,可以直接在桌面或用戶的手掌上,投影出文字與介面。

延伸閱讀:OpenAI創辦人也看好,前Apple員工打造讓「螢幕消失」的AI投影設備

Meta x Ray Ban 融合AI的智慧眼鏡

另外一個大動作的是Meta。Meta近期宣布與眼鏡品牌Ray Ban合作,推出新一代的智慧眼鏡,並整合了Meta開發的AI助理。眼鏡的鏡架上附帶鏡頭,可以辨識使用者眼前的畫面,並提供協助,例如提供資訊或即時翻譯。Meta創辦人Mark Zuckerberg近期更在Instagram上親自示範,讓智慧眼鏡手把手教學如何幫女兒綁辮子

更有趣的是,配戴者也能使用Ray Ban智慧眼鏡直接開啟Facebook或Instagram直播,讓創作者無需再拿起手機,直接用第一視角分享眼前畫面。

Zuck on Instagram
Mark Zuckerberg近期在Instagram示範,讓智慧眼鏡手把手教學如何幫女兒綁辮子。 @Zuck on Instagram

《黑鏡》真實版?「個人生活的搜尋引擎」Rewind Pendant

另外一款有趣的AI穿戴裝置,則是由新創Rewind推出的Rewind Pendant。這個看起來像是吊墜的裝置,可以讓用戶捕捉在現實世界中所說以及聽到的一切。

Rewind Pendant
由新創Rewind推出AI穿戴裝置的Rewind Pendant。 Rewind

例如,你開了整天的會議,想與朋友分享,Rewind Pendant的AI助理即可幫你彙整摘要;又例如,你口頭承諾為別人做某些事情,它也可以自動生成代辦事項。Rewind Pendant有如一款「個人生活的搜尋引擎」,讓你不再健忘,隨時回溯想要重溫的生活片段。

而掀起這波AI浪潮的主要推動者OpenAI,似乎也沒有在這場競賽中缺席。據傳OpenAI、蘋果前鬼才設計師Jony Ive以及軟銀集團正在組隊,打造一款殺手級消費性裝置,外界紛紛猜測,這三強聯手,將推出像iPhone一樣具有革命性的消費產品。

延伸閱讀:打造個人專屬的「記憶宮殿」,獲億元投資Rewind讓說出、聽到的每一句話都能搜尋

人人都有Jarvis的時代不遠了?兩大原因推動AI民主化

隨著AI技術快速進展,我認為,有2大趨勢正在驅動AI穿戴裝置的普及,以及AI真正的民主化。

首先,LLM將走向兩極化,除了大型LLM以外,未來將可能有更多小型LLM跑在穿戴裝置、智慧型手機上。

隨著訓練AI模型的參數量越來越多,研發LLM已經進入大者恆大的軍備競賽。因為訓練成本高昂,大型LLM成了少數擁有龐大資源的企業才能玩得起的遊戲。不過,目前已經有不少研究往小型LLM發展,而隨著技術不斷創新,未來小模型將很可能克服挑戰,達到與大型LLM相當的效能。

隨著技術突破,未來我們將很可能看到用戶透過智慧手錶、智慧眼鏡或其他穿戴裝置,與AI進行自然語言對話,獲得即時的資訊與建議,屆時,將會是AI民主化的真正起點。

第二,多模態(Multimodal)AI的出現。所謂多模態,指的是結合了語意、圖像、視覺、音訊的AI模型。我認為,使用單一模型,就能執行各樣任務的AI一定會到來。未來我們將能見到高度個人化與智慧化的產品,穿戴裝置將不再只是資訊輸出工具,更可以是一個進行深度對話的夥伴。

舉例來說,Meta近期推出的SeamlessM4T,就是一款多模態AI模型,可以辨識近100種語言,並支援語音聽寫、語音聽寫翻譯、語音轉語音等應用。

Meta_SeamlessM4T
Meta推出的SeamlessM4T可以辨識近100種語言,並支援語音聽寫、語音聽寫翻譯、語音轉語音等應用。 Meta

可以想見,如果這一類多模態AI能應用在智慧眼鏡或其他穿戴裝置上,將能執行多樣任務,戴上這類裝置的人們,就如同帶了一個超級助手在身上,可以即時解讀資訊、照片、更能讓人們如同吃了「翻譯蒟蒻」一般,即時翻譯外國語言,未來就算雞同鴨講,也能順暢溝通。

所以,回到最初的問題,AI正在經歷「iPhone時刻」嗎?我認為,在技術快速革新下,我們一定會看到一個比現在智慧型手機更普及、且高度個人化的新時代到來,而穿戴裝置,將會是實現這個理想重要關鍵之一。

本文授權轉載自《心元資本》,作者:鄭博仁,原文標題:AI正在經歷「iPhone時刻」嗎?下一個殺手級應用在哪裡?

延伸閱讀
本文作者 鄭博仁 鄭博仁

心元資本Cherubic Ventures創始執行合夥人,是同時活躍於矽谷及亞洲的天使投資人,也是矽谷Hims、台灣91APP、日本Paidy等全球多家獨角獸上市企業的早期投資人之一,屢獲矽谷第一線知名創投與美國主流媒體關注。除投資人與連續創業家的身份外,也曾是台灣青少年網球單雙打排名第一的選手。

使用會員功能前,請先登入

  • 收藏文章
了解更多關於創業小聚的資訊,歡迎透過以下服務: