You are now offline.

年成長2倍!台灣是Android版Google翻譯成長最快的市場

翁書婷
翁書婷 2017-05-04
年成長2倍!台灣是Android版Google翻譯成長最快的市場
Google
分享
收藏
已完成
已取消

你知道嗎?每三個網路使用者,就有一個人經常使用Google翻譯。

Google指出,Google翻譯每天進行超過10億次的翻譯,大約等於100萬本書的字數。每月超過10億活躍使用者。

台灣是Android版Google翻譯成長最快的市場

有92%的Google翻譯使用者來自美國以外的國家,且在巴西有最多的使用者。

台灣是Android版Google翻譯成長最快的市場。和2015年比較起來,2016年台灣使用者Android版年成長2倍,iOS版年成長則是60%。

Google台灣董事總經理簡立峰指出,為了顧及資料量,以及繁體中文與簡體中文文法語言結構相同,兩者共用同一個資料庫。而在翻譯品質精進的部分,除了單靠Google研發團隊的努力,「社群」校正的力量也是非常重要的。

Google神經機器翻譯(NMT)發展進度超前

以往Google翻譯以片語式機器翻譯(Phrase-Based Machine Translation)作為主要運算方式。將句子切割成小塊語言單位,之後針對各別語言塊進行翻譯,最後再將這些語言塊組合成看似句子的目標語言。

Google 翻譯.jpg
從片語式機器翻譯(PBMT)到神經機器翻譯(NMT) 大幅改善 Google 的翻譯品質。 Google

而2016年九月宣布的Google神經機器翻譯系統(Google Neural Machine Translation,GNMT),則是將整個輸入的句子視為一個單位進行翻譯。神經機器翻譯能夠打造出更好的翻譯品質,大幅降低了相對誤差,讓機器翻譯的品質更接近譯者。

螢幕快照 2017-05-03 下午1.48.38.png
Google翻譯服務中,英文翻譯成西文能獲得較高的翻譯品質。 Google

Google翻譯產品經理卡蒂奥(Julie Cattiau)指出,神經機器翻譯技術(NMT)的複雜模型架構需要8個Google處理器(Google processing units)來運算,因此每個模型的訓練需花費數週的時間。而每個GNMT模型的訓練時間約2-3週,而每個模型需超過1億筆訓練案例。目前,Google翻譯現有的語言組共達1,032組。

雖是如此,GNMT發展速度卻超前,原先預期需耗時36個月才能完成神經機器翻譯導入Google翻譯的服務,最後導入成果超乎預期,僅耗時13.5個月(註1)。

多語言互譯:Zero-Shot翻譯系統

面對多種語言翻譯的情境,Zero-Shot讓兩種語言經過訓練後可自動學習,且不需額訓練就能自動翻譯另一種全新語言。

舉例而言,Zero-Shot翻譯在進行英日、韓英翻譯訓練後,不僅可完成英日、日英、英韓、韓英的互譯,更可在藉由導入Zero-Shot翻譯就能完成之前沒有經過任何相關訓練的第三種語言。

如韓日、日韓的互譯。藉由Zero-Shot翻譯,Google僅需要一套系統就能完成所有語言的互譯。

目前推出的16組語言組中,共有10組語言組已經採用Google神經機器翻譯系統(GNMT)。而透過強大的運算,在短短兩個月內將10秒翻譯一句話的速度,縮短到0.2秒就能完成。

Google 翻譯的下一步

Google指出,提早截斷(Early Cutoff), 適時地截斷或捨棄來源句子裡的單詞、加強數字與日期翻譯、簡短、罕見字串的翻譯與名詞與品牌翻譯都是Google下個階段努力的目標。

註1:Google翻譯重要里程碑
■ 2015 年 9 月:以 TensorFlow為核心開始執行專案
■ 2016 年 2 月:第一次產品數據報告
■ 2016 年 9 月:中英對譯上線
■ 2016 年 11 月:16 個語言組上線
■ 2017 年 3 月:7 個語言組上線(印度語、俄語、越南語)
■ 2017 年 4 月:26 個語言組上線(包含印度語)

提供您第一手最豐富的創業資訊!
現在就加入「創業小聚 Line@-數位創新與創業的社群平台!

本文授權自《數位時代》,作者:翁書婷

本文作者 翁書婷 翁書婷

《數位時代》評論主編

使用會員功能前,請先登入

  • 收藏文章
了解更多關於創業小聚的資訊,歡迎透過以下服務: