You are now offline.

打擊AI髒數據!台灣開發者的Recce獲1.3億種子資金,進軍全球市場

打擊AI髒數據!台灣開發者的Recce獲1.3億種子資金,進軍全球市場
蔡仁譯攝影
分享
收藏
已完成
已取消

當全球企業爭相擁抱AI,一個根本性的挑戰也浮出水面:「Garbage In, Garbage Out(垃圾進,垃圾出)」。AI模型的表現,高度依賴其數據品質,一旦源頭數據出錯,結果便可能充滿偏見甚至謬誤。

為了解決這個AI時代最棘手的「髒數據」難題,由台灣知名開發者高嘉良創辦的新創Recce,近日宣布完成400萬美元(約新台幣1.3億元)種子輪募資,共同參與的投資方還包括Vertex Ventures US、Hive Ventures以及Visionary、Essence VC等多家機構與天使投資人。

這筆資金將用於推動Recce的全新雲端平台。作為一家專為數據轉換專案和AI系統提供「數據原生程式碼審查工具」的公司,Recce的目標,正是在混亂的AI資料世界中,建立起第一道最關鍵的防線。

從Code Review到 Data Review,Recc如何鎖定核心需求?

高嘉良不但是g0v(零時政府)的共同發起人,其早年開發的版本控制系統SVK更是Git的重要前身。在前一個創業項目InfuseAI中,他致力於降低企業導入AI的技術門檻,打造PrimeHub平台協助台灣人工智慧學校等單位快速建立開發環境。

這種為開發者服務的模式,也讓他發現了AI領域的下一個戰場:如何確保資料品質是可靠的?

InfuseAI工合執行長高嘉良
Recce創辦人、InfuseAI工合執行長高嘉良 蔡仁譯攝影

「我們相信,在AI時代,資料的正確性將成為成功的決定性因素,未來絕大多數的『程式碼審查』,都將演變成『數據審查』。」高嘉良表示,過去,軟體工程師習慣在提交程式碼前進行審視,確保邏輯無誤。但如今資料本身就如同程式碼一樣,需要被系統性地管理與驗證。

傳統上,當數據工程師修改了一段SQL程式碼,很難確定這個改動會對最終生成的報表、或是 AI模型的訓練資料造成什麼具體影響。高嘉良認為,數據工程師、資料科學家們迫切需要一套工具,能像Git比對程式碼差異一樣,直觀地比對「數據」的差異。

Recce
Recce使用介面圖。能夠從譜系與元資料開始,找出關鍵點並進行差異分析。 Recce

為此,Recce的開源專案在2023年誕生,能夠無縫整合進dbt等主流數據轉換工具的工作流程中,提供資料比對、驗證清單等功能,Recce能並排比較修改前後的數據結果,從單一欄位的數值分佈,到整張表格的細微變化都一目了然。開發者可以建立可重複使用的驗證清單,確保每次變更都不會破壞數據的完整性。

這種化繁為簡的能力,讓Recce迅速獲得了全球用戶的信賴。

目前,Recce的產品便已整合至美國百年大報《費城詢問報》的工作流程之中,自動化了超過50個下游數據模型的驗證工作。除了媒體業,Recce的用戶還擴及巴西、澳洲等地的政府機構,以及電信、醫療科技等領域的新創,並在GitHub上創下每週超過3,600次的下載量。

獲Heavybit押注400萬美元:Recce的下一步是什麼?

本次Recce完成種子輪募資,由Heavybit領投,Vertex Ventures US、Hive Ventures以及Visionary、SVT Angels、Brighter Capital、Ventek Ventures等創投及天使投資者也參與其中。

本輪的領投方Heavybit是專注於投資開發者工具的創投,其合夥人Jesse Robbins將加入Recce董事會。他表示:「數據流是每家AI公司打造護城河的『新祕方』,而Recce提供了解放數據全部價值的關鍵工具組。」

展望未來,Recce將運用這筆資金,正式發表開源專案Recce OSS 1.0版本,並同步推出專為團隊協作設計的SaaS平台Recce Cloud。

該平台讓團隊成員能共享驗證情境、比對結果,並能與GitHub等平台深度整合,確保只有在所有數據檢查都通過的情況下,程式碼才能被合併。此舉也代表著Recce正式從開發者工具,進化為企業級的數據治理平台,準備搶佔全球 AI基礎設施的龐大市場。

參考資料:《businesswire》

延伸閱讀
本文作者 賴冠伶 創業小聚採訪編輯 賴冠伶

遊走在人文與科技之間,雖然是個J人,但卻熱愛各種跳出框架、叛逆的人事物。2011年起《數位時代》開始以Meet社群品牌推動創業家們的交流連結。從新創團隊的採訪報導、創業小聚月會的分享、產業沙龍的分享, 提供創新與創業社群相互分享與媒合的平台。 新創團隊採訪請來信:lauren.lai@bnext.com.tw

使用會員功能前,請先登入

  • 收藏文章
了解更多關於創業小聚的資訊,歡迎透過以下服務: