在人人都能擁有自媒體的年代下,YouTube 成為大勢影音平台之一,催生出許多素人網紅,甚至百萬訂閱級的 YouTuber,因而成為越來越多人的夢幻職業選項。
然而,要想成為YouTuber,除了該擁有創新的點子外,在技術面也需要有攝影器材、剪片技能、以及服務觀眾的上字幕工程。
AI自動分段、友善UI介面為服務亮點
Taption 的服務瞄準現今中文影音市場對於上字幕工程耗時費力的問題,以 AI 技術將影片轉換為文字檔,特別的是,經 Taption 轉換後的文字,自動配對影片時間軸產生內崁時間碼,省去手動調整時間的步驟,簡化最讓 YouTuber 頭痛的工作。
「科技就是在解決無趣、高重複性、又耗時的工作。」Taption 創辦人暨執行長 Jay Chen 點出 Taption 服務的核心。
當使用者進入 Taption 頁面後,不需下載程式,便能註冊並選擇服務方案。目前 Taption 支援三種上傳檔案方式,分別為:電腦上傳、YouTube 連結、或 Google drive 匯入檔案,之後選擇匯出形式,可為具時間碼的純文字檔、含字幕的 mp4 影片檔、或是可直接上傳 YouTube 的 srt 檔。
「 Taption 以 AI 技術自動分段功能,因此用戶不需擔心字幕和音檔錯位問題」 Jay 解釋 ,若需針對用字進行修正,Taption 也提供人性化的 UI 介面,讓用戶編輯無礙,也能直接調整字幕大小和字體基本設定。針對部分專業領域,如醫療、商業、金融、教育等,用戶也能在匯入檔案時便勾選對應選項,以利 AI 語音辨識時,能更精準判斷特定領域的專有名詞。
至於 Taption 內建的 AI 辭典功能,讓用戶得以根據需求匯入特定用字,往後系統將針對該語音認定作出調整。除了單純就語音辨識轉為文字外,Taption 也提供翻譯功能,目前已支援50多國語言,在翻譯上,AI 將影片或音檔整部翻譯後,再分段匯入相應段落,以提高文意準確度,但以內容精準性而言,仍以中、英為主。
提供 Saas 服務的 Taption,目前有三種訂閱方案,分別是以影片長度計價的基礎60分鐘方案、每個月充值且能跨月累積的高級120分鐘方案、以及大量訂閱的方案,三者皆能以相應優惠價格充值更多服務時間。
接受華大醫學博士請託,意外踏上創業路
談及創業契機,Jay Chen 表示 Taption 的創立始於一個請託。
2018 年,Jay 受到兩位華盛頓大學醫學博士的請託,希望能協助他將和病人的錄音檔轉為逐字稿。「我是電子工程背景,當時在網路上藉開源平台和自己的技術,用 API 幫他完成轉檔。」當 Jay 回傳檔案後,對方再次詢問能否提供修改、編輯的介面。面對越來越多的需求,Jay 認為這項服務具潛在應用市場可以拓展,從此以正職工作之餘的 side project 形式,著手開發 Taption,並以網路上的開源資源和購入的數據資源,訓練自身 AI 技術。
事實上, Jay 是和臺裔美籍的室友共同開發 Taption 。「從日常生活觀察他對於小細節的講究,加上他在亞馬遜負責軟體開發,我們專業相似,最後順理成章成為夥伴。」Jay 認為,創業夥伴選擇上,和交情普通的友人共事,優於熟識的關係, 「以公事公辦的相處模式一起創業,能減少一些情理上的顧慮。」
美國字幕需求低,目標市場轉向亞洲國家
「當時有針對市場應用的一般性點子,工具也成形,但方向未明。」Jay 接著解釋,Taption 出於需要營收緣故,於 2020 年 4 月在西雅圖成立公司,而服務上線時間的 8 月正值疫情封城,大眾於線上影音平台的觀看時間大幅提升,原先認為字幕需求會增加,但美國講究畫面美觀,較少字幕需求,因此 Taption 目標市場轉向亞洲國家。
「目前以服務中文市場為主,主要對象包含 YouTuber、線上教學平台、商業和宗教影片,以及 Podcaster。」Jay 表示,初始用戶多為朋友轉介,而後向外推廣,目前台灣用戶佔比過半,美國約佔 2 成,剩餘則是香港、日本等地用戶。
Podcast也有字幕需求,協助建立搜尋便利的資料庫
對 Podcast 市場而言,聲音轉逐字稿檔案的需求在於,在大量純音檔中,有別於文字得以快速瀏覽的特性,對創作者、聽眾、甚至廣告主而言,聲音碎片化且無法追蹤使其難以快速找到正確資訊。近期 Clubhouse 加入聲音創作戰場,讓聲音市場更加活絡,相應需求也日漸提升。
目前市場上有台灣耳熟能詳的自產開發的語音轉文字App、中國知能的語音上市公司等,甚至日前也傳出中華電信和 SoundOn 合作開發「AI 語意雲」,都應證了這塊市場的競爭白熱化。
創業頻頻遭「唱衰」,還是會堅持做下去!
Jay 對此回應,創業期間常遭受旁人冷言冷語,不是認為市場飽和,便是理念遭「唱衰」。但 Jay 堅定地表示,這些日子領悟到:「Avoid taking advices as conclusions, especially from those with existing social status. 」他解釋, AI 自動分段和便捷的 UI 介面是 Taption 的優勢,雖偶有動搖之心,但對於市場仍有執著,會繼續做下去!
Jay 表示,Taption 目前主要支出在於伺服器租金、Google 廣告、Facebook行銷、媒體曝光等,但現階段已達損益平衡。未來 Taption 會將重心放在台灣市場,希望尋找策略性投資人,協助提高平台曝光度和訂閱用戶數。
創業快問快答
Q:服務的創意來源,是因為發生甚麼事情而有這樣的想法?
A:來自意外,幫忙兩位在華大就讀醫學院朋友的final project. 起初只是簡單把醫生錄音轉成文字。後來要求越來越多,覺得即然已經投入時間在這方面,應該想辦法以某種形式盈利能幫到她們應該也能幫到其他有類似需求的族群,從而創立了Taption。
Q:長遠來看,公司想成為一家何種類型的公司?下一步的目標是什麼?你們如何完成?
A:除了原始的初衷希望可以不斷的增加訂閱數以外,目前也希望能和不同的平台來做合作。 Outbound marketing strategy
Q:創業至今,做得最好的三件事為何?
A:
技術面: ai個人辭典讓用戶 , scalable backend to handle large volumes of requests,clean UI
非技術面: 時間規劃,資金用在刀口上。
團隊資訊
公司名稱:音易 Taption LLC
成立時間:2020/4/10
產品名稱:語音影片轉字幕平台
上線時間:2020/8/30
團隊人數:5 名
新創資料庫|官方網站

新創團隊採訪請來信:meet@bnext.com.tw
2011年起《數位時代》開始以Meet社群品牌推動創業家們的交流連結。從新創團隊的採訪報導、創業小聚月會的分享、產業沙龍的分享, 提供創新與創業社群相互分享與媒合的平台。