You are now offline.

Vision Pro讓電腦視覺崛起?Phiar創辦人、現Google工程主管提出3大AI趨勢

Vision Pro讓電腦視覺崛起?Phiar創辦人、現Google工程主管提出3大AI趨勢
蘋果WWDC發布會截圖
分享
收藏
已完成
已取消

1966年,人工智慧之父Marvin Minsky在暑假期間找了一批MIT學生進行一場研究:把攝影機連上電腦,讓電腦解釋它看到了什麼。

雖然當時這項研究沒有獲得實質的成果,卻開啟了至今近60年的電腦視覺研究之路,而且這條路還沒到盡頭。

「我覺得自然語言生成式AI的爆發是電腦視覺的下一個機會,無論在自動駕駛、AR還是機器人的應用上都會有所突破。」AI/AR導航新創Phiar創辦人、現Google Maps工程主管余正平,以自身豐富的電腦視覺經驗,分享了他對電腦視覺前景的看法。

Phiar創辦人、Google Maps工程主管余正平
Phiar創辦人、Google Maps工程主管余正平以遠端連線的方式分享對電腦視覺的看法 BN
延伸閱讀:台灣人創辦的矽谷AR導航新創Phiar被Google併購!將強化駕駛體驗市場

除了人臉辨識、自動駕駛,電腦視覺的下一個戰場是Vision Pro?

究竟什麼是電腦視覺?余正平給出了自己的定義:

讓電腦透過鏡頭接收影像,進而辨識、分析、偵測、確認與生成影像。

現在常見的電腦視覺應用包含用於辨識道路狀況的自動駕駛、與資安或濾鏡娛樂相關的人臉辨識,還有從去年爆紅的生成式AI應用,這些技術有些是最近才成熟,有些可能早在2010年就已經問世,例如Meta(當時的Facebook)早在那時候就已經會問你是否要標註照片中的「朋友」。

余正平表示,下一個該關注的是AR與VR領域的應用,「為什麼?像是這次Vision Pro的發表會就用到了手勢辨認,還需要眼球偵測。」余正平說。而未來如果AR應用在室內外的定位的話,就像是自動駕駛的應用場景一樣,所以電腦視覺在AR的應用是可以預期的。

蘋果WWDC VISION PRO
Vision Pro在眼球追蹤與手勢追蹤上都需要AI輔助。 Apple WWDC發布會截圖

電腦視覺發展的3大趨勢:邊緣運算、晶片和生成式AI

從車子、手機到眼鏡,隨著電腦視覺在各式各樣的載具上運作,余正平也提出如果電腦視覺要跨到下一個階段的3個條件:

  1. 邊緣運算:如果要加強AI判讀即時性,同時避免資料傳輸時的資安風險,那未來勢必要捨棄雲端運算的方法,改以在終端裝置上運算。

  2. 更強大的晶片:為了因應終端運算的需求,更輕便、更快速、更強大的晶片是必要的基礎。

  3. 與生成式AI結合:電腦視覺如果結合大型自然語言模型(LLM),將可以帶來更深一層的體驗,例如開車時詢問:前面的測速照相速限是多少?AI可以判讀測速照相的位置、速限數字並直接回答,將能真正實踐電影《鋼鐵人》的場景。

TAGS: # AR # AI
延伸閱讀
本文作者 曾令懷 創業小聚內容採編 曾令懷

騎車、拍照、寫寫稿。

2011年起《數位時代》開始以Meet社群品牌推動創業家們的交流連結。從新創團隊的採訪報導、創業小聚月會的分享、產業沙龍的分享, 提供創新與創業社群相互分享與媒合的平台。

新創團隊採訪請來信:vincent.tseng@bnext.com.tw

使用會員功能前,請先登入

  • 收藏文章
了解更多關於創業小聚的資訊,歡迎透過以下服務: