You are now offline.

揭開神秘AI新星面紗:Thinking Machines Lab將推首款產品,a16z、NVIDIA搶先下注20億美元

揭開神秘AI新星面紗:Thinking Machines Lab將推首款產品,a16z、NVIDIA搶先下注20億美元
https://www.youtube.com/watch?v=Ru76kAEmVfU
分享
收藏
已完成
已取消

OpenAI前技術長穆拉蒂(Mira Murati)所創立的Thinking Machines Lab,外界對其挖角OpenAI研究團隊組新班底,以及如何利用20億美元新資金進行研究、開發產品充滿好奇。

Thinking Machines Lab近日發表部落格文章,穆拉蒂的研究團隊首次公開其中一項專案內容:打造能重現回應的AI模型。

這篇標題名為《克服LLM推理中的非確定性》(Defeating Nondeterminism in LLM Inference)的文章,試圖釐清導致AI模型回應出現隨機性的根本原因。比方說,向ChatGPT重複提問一個問題多次,很可能得到截然不同的答案。如今AI業界普遍接受現有AI模型被視為非確定性系統,然而Thinking Machines Lab認為這是可以解決的問題。

文章作者、Thinking Machines Lab研究員Horace He主張,AI模型隨機性根本原因,來自推理處理過程將GPU核心(即在NVIDIA晶片內部運作的小程式)拼接運作的方式。他認為,透過仔細控制這層編排,就有可能讓AI模型變得更具確定性。

除為企業與科學家打造更可靠的回應以外,Horace He也提到,讓AI模型生成可重現的回應,還能改善強化學習(Reinforcement Learning,RL)的訓練過程。強化學習是透過對正確回答進行獎勵來教導AI,但若每次回應略有差異,訓練資料就會受到雜訊影響。讓AI回應更為一致,可使整個強化學習流程更順暢。值得一提的是,根據外媒The Information先前報導,Thinking Machines Lab向投資人表示,計劃利用強化學習為企業量身打造AI模型。

在矽谷創投Andreessen Horowitz(a16z)領投下,Thinking Machines Lab募得20億美元資金,這輪還有NVIDIA、Accel、ServiceNow、思科、AMD、Jane Street參與投資,使公司估值來到120億美元。

穆拉蒂在7月曾表示,Thinking Machines Lab首款產品將在未來數個月內亮相,將對研發客製化模型的研究單位與新創團隊有所幫助。目前還不清楚產品細節為何,或者是否會採用上述研究以做到重現回應的可能性。

Thinking Machines Lab也承諾,將定期發表文章、程式碼及研究資訊,期望「造福大眾,同時提升我們自己的研究文化」。相比之下,OpenAI成立初期時也強調開放研究,如今營運規模擴大後反而走向封閉。

本文授權轉載自《科技新報》,作者:陳冠榮,原文標題:新創 Thinking Machines 發表首篇研究文章,希望讓 AI 模型更一致

TAGS: # AI
延伸閱讀
本文作者 《科技新報》陳冠榮 《科技新報》陳冠榮

報導有價值、有意義的資訊,同時也會有具備全局觀點、個人觀點的意見或評論刊載,為市場和業內人士關心的趨勢、內幕與新聞。

使用會員功能前,請先登入

  • 收藏文章
了解更多關於創業小聚的資訊,歡迎透過以下服務: