You are now offline.

一句話自動產生SQL語法,瞄準數據處理的Numbers Station獲近4億元募資

feature picture
Numbers Station
分享
收藏
已完成
已取消

根據外包數據清理平台CrowdFlower的調查指出,資料科學家有60%的工作時間花在「清理數據」,而非真正的數據分析。就算所有企業都了解「數據驅動」(Data-Driven)的重要性,資料處理仍是無可必免的苦工。

新創Numbers Station把近來火熱的「生成式AI」運用在資料處理的環節上:使用者只要輸入一句話,即可自動產生SQL語法,在龐大的數據庫中撈取數據。如某產品的月銷量、本季營業額前三的產品,還能夠直接建立AI模型,連不懂程式語言的工作者也能使用,在今(2023)年3月獲得1,250萬美元的A輪募資。

Numbers Station.gif
Numbers Station專門解決數據分析的上一層工作:數據清理。 Numbers Station

Numbers Station期望讓資料科學家專注在「最重要的事」

Numbers Station是由史丹佛大學博士Chris Aberger、Ines Chami、Sen Wu,以及副教授Chris Ré共同創辦。

「我們看到大多數AI人才專注於行銷內容、圖片生成功能,鮮少專注於處理龐雜的數據格式、資料前清理,但這仍然是一個巨大的企業問題和企業需求。」Numbers Station執行長Chris Aberger說道。

執行數據分析之前,如果沒有清理乾淨的數據,就難以產出具有正確見解的洞察,也就是常見的「垃圾進、垃圾出」(Garbage in, garbage out),如果大多原始數據(Raw Data)錯誤、重複或缺失,在尚未清理之前便建立AI模型,會降低AI模型的準確率。不過因數據龐大、來源多樣,使得數據清洗工作一直相當困難。

Chris Aberger指出,數據分析、清理能力需要一定程度的門檻,因此數據往往只能由公司一部分的人掌握,不論是初階數據的存取或是AI模型,都仰賴這小部分的人,「我們想讓資料科學家花更多的時間提供洞察,花更少的時間在這些平凡的數據清理上。」

Numbers Station讓公司人人都能寫SQL、建立AI模型

2021年Numbers Station正式成立,專門給企業提供生成式AI服務,為資料科學家省去重複又耗時的數據清理、重複數據刪除、正規化(Normalization)等工作,但目前僅提供SQL語言使用。

Numbers Station的目標簡單來說,就是讓數據清洗不再困難,也不再限於具有專業知識的人。具體來說分成3個部分:第一是提高效率,讓資料科學家專注於更重要的工作,例如解釋數據、制定決策;二是提高數據品質,透過AI自動糾正並識別數據問題;三是數據存取權民主化,讓公司所有人皆能執行數據撈取、建立AI模型工作。

為了達到上述目標,Numbers Station的產品提供3大服務來加速數據的清洗、存取與使用:

  • 自動生成SQL語言
    SQL語言大多應用在資料庫查詢,如客戶訂單、銷售趨勢等,藉由Numbers Station,使用者便不用學習SQL語言,只要輸入口語化的指令,例如「在A資料表中尋找價格大於1,000的商品」,即可得到一串SQL公式,直接撈取需要的數據。

  • 自動建立AI模型
    Numbers Station也能自動建立AI模型,以客戶評論來說,使用者只要輸入一句話,如「這些顧客最喜歡這支產品的哪一個地方?以一個單字摘要,例如價格、尺寸合適度、風格等」,Numbers Station就會自動為資料及貼上標籤,接著使用者只需要檢驗標籤是否正確,回饋並修正,即可建立一套AI模型。

Numbers Station
Numbers Station可以讓程式小白直接建立AI模型。 Numbers Station
  • 自動整併資料庫
    由於公司的多個資料集可能散佈在不同平台,Numbers Station能直接將SAP、Salesforce、Snowflake等資料直接合併在一起。
Numbers Station
Numbers Station自動整併資料集功能。 Numbers Station

以Numbers Station過去的一間企業客戶來說,該企業擁有兩個客戶關係管理系統(CRM),各自管理線上與實體門市的顧客,兩邊數據呈現孤立狀態。為了得知顧客在線上、實體的消費情形,企業希望將兩邊數據整併在一起,讓行銷及業務團隊追蹤全面的消費者購物旅程。

但困難的是,企業中不同實體門市的數據雜亂,出現許多缺失值、格式錯誤的狀況,導致數據整併工程需要耗費許多精力,最後使用Numbers Station後,兩邊數據匹配率98%,工作速度提升10倍,為數據分析團隊大幅節省時間成本。

對於生成式AI熱潮,Numbers Station執行長:「加入自身專業」才是成功關鍵

今(2023)年3月,Numbers Station獲得1,250萬美元A輪募資,由Madrona領投,並包含Norwest Venture Partners、Factory等其他投資人。

Madrona投資人Tim Porter和Jon Turow說,投資Numbers Station的原因之一是團隊成員背景具有技術實力,可以為更多企業導入AI,降低技術使用門檻,像是Chris Aberger過去就在美國人工智慧軟硬體獨角獸SambaNova Systems領導機器學習團隊。

資料視覺化企業Tableau的前執行長Mark Nelson也發表看法:「Numbers Station正在解決數據行業幾十年來存在的挑戰。他們的平台和底層AI技術正在為現代數據工作帶來根本性的轉變。」

現行許多公司使用ChatGPT原先的Open AI模型打造產品,Chris Aberger也提出相應看法。在他看來,由於ChatGPT僅抓取網路上的資訊,無法涵括所有知識、專業,僅能達到及格水準,因此需要再微調才能做到將近滿分,做出產品差異化,「真正重要的是,你在這些模型上的哪些地方應用AI專業知識,使它們在特定組織的任務中表現良好。」

參考資料:TechCrunchbusinesswireThe Analytics Engineering Roundup

提供您第一手最豐富的創業資訊!
邀請您加入「《創業小聚》LINE官方帳號

TAGS: # 募資 # AI
延伸閱讀
本文作者 黃弈軒 創業小聚實習生 黃弈軒

21歲,吃飽心情就會變好,希望未來可以養一隻柴犬每天逗我笑。

2011年起《數位時代》開始以Meet社群品牌推動創業家們的交流連結。從新創團隊的採訪報導、創業小聚月會的分享、產業沙龍的分享, 提供創新與創業社群相互分享與媒合的平台。

新創團隊採訪請來信:meet@bnext.com.tw

使用會員功能前,請先登入

  • 收藏文章
了解更多關於創業小聚的資訊,歡迎透過以下服務: