創業新聞

台大資工研發團隊領軍!藍星球幫你分析上千則新聞,用中文資料分析技術找出大家在想什麼

1992年開始,為了保存重要的文獻資料,防止資料因年代久遠而損毀,國家政府單位與台灣大學合作「數位典藏國家計畫」,將檔案館、美術館、博物館等地的館藏品數位化,將資料系統性整理以及運用各種文本分析技術分門別類,也因於此,隨著時間累積台大資訊工程實驗室累積、發展出相當程度的中文語意分析技術。

二十年後,數位典藏國家計劃告一段落,為了保存這二十年來研發的各種中文文本分析技術,台灣大學成立技轉公司藍星球科技,並由台大資工系的研發團隊領軍。藍星球的技術主要為中文資料分析技術,其中可分為三大核心技術為「中主要文探勘分析技術」、「中文檢索引擎」、「數位人文架構」。

中文探勘分析技術—透事THOUGHTS

藍星球在執行數位典藏國家計劃的過程中所累積的種種中文分析技術,例如智慧分類、詞彙萃取、自動摘要等等所整合的最終產品稱作「透事THOUGHTS」,此產品預計於明年初推出,提供六項功能分別為詞彙萃取、自動摘要、情緒感測、智慧分類、猜你喜歡、觀點聚類

藍星球科技

當分析完一篇文章後,首先透事會先將該篇文章分門別類,如政治、休閒、社會議題等等。接下來會提供摘要文章,依照中文文字分析的技術自動摘要重點,使用者可以選擇文章的20%、50%及80%摘要,再來是會提供整篇文章的關鍵詞彙,並偵測該篇文章的情緒,分析裡面的內容是屬於負面還是正面,最後則是會根據使用者的瀏覽資訊,提供可能感興趣的文章連結。

藍星球科技

新聞輿情監測—蛛思

蛛思為藍星球另一將於明年初推出的中文分析產品,同樣運用藍星球二十年來累積的中文分析技術,蛛思的定位為新聞輿情監測,會自動分析每天的新聞進而告訴用戶目前的新聞趨勢走向、Top50的熱門詞彙,以及其他讀者對某個新聞議題的評價。

團隊表示,這項功能將能夠提供專職社群管理人員更加了解目前流行趨勢,而夠提供使用者相對感興趣的內容。此外,蛛思也提供競品比較,讓用戶可以得知自家公司在網路上的曝光度或特定產品的曝光度跟競爭公司的差別。

藍星球科技

其他公司難以抗衡的中文分析技術

藍星球的副總經理宋浩說道,雖然文本分析在科技領域是一個熱門的議題,但目前主要都以英文文本分析為主,而且由於中文結構的不同,中文文本分析是一個技術含量極高的學問,一般公司難以隨便進入這個領域,而這就是藍星球的優勢。

至於公司的定位,藍星球的產品經理則說道,在網路的時代,如果將資料比擬為金礦的話,藍星球想扮演的則是賣鏟子的角色,提供一個方便的工具讓大家在網路的時代掏金。

創業快問快答

創業至今,做得最好的三件事為何?

找到志同道合的夥伴、堅持技術本位、每件事都要做到比 100 分更好的標準。

創業,教會了你哪些事?簡單分享創業至今以來的心得感想?

過去我們都是跟電腦溝通,現在我們對內需要跟團隊溝通、對外需要跟客戶溝通,與人溝通的難度遠遠高過與電腦溝通。

最常被客戶或投資人問起的事情?您會如何回應?

我們最常被問起,團隊成員平均年齡不到30歲,有辦法掌握如此艱難的技術嗎?我通常回答,Larry Page 成立 Google 時 25 歲、Steve Jobs 成立 Apple 時 21 歲、Bill Gates 成立 Microsoft 時 20 歲、Mark Zuckerberg 成立 Facebook 時 20 歲,永遠不要小看年輕人成立的科技公司的技術能量

公司的大事紀

2013年:藍星球資訊股份有限公司創立。研發團隊多為臺灣大學資訊工程學系自動推論與數位典藏實驗室畢業生,長年致力於數位化、後設資料分析、數位加值及資料庫檢索技術整合之服務與研發。

2015年:藍星球長年致力於數位化、後設資料分析、數位加值及資料庫檢索技術整合之服務,包含文化部、內政部、外交部國際傳播司等政府單位之專案計畫,獲極高的肯定,近年更致力於創新發展。

2016年:近年藍星球承接包括臺北市政府文化局、資訊局、林務局、宜蘭縣史館、臺灣客家委員會等政府機構之數位典藏相關專案,建立優質品牌,並積極創新應用技術,使數典資源被更廣泛的運用。

2017年:發表透事THOUGHTS: 中文探勘分析系列技術/蛛思Choose:輿情智慧分析平台兩套產品。

公司資訊

公司名稱:藍星球資訊股份有限公司
公司服務:透事THOUGHTS(中文探勘分析系列技術)/蛛思Choose(輿情智慧分析平台)
成立時間:2013/1/15
團隊人數:24人
官方網站

了解更多關於創業小聚的資訊,歡迎透過以下服務
粉絲交流每月小聚Line@互動訂電子報發表專欄及新創資料庫