2020 年起,全球陷入了長達 3 年的 COVID-19 疫情時代,當時各國無不積極投入疫苗與蛋白質藥物的開發,但 Omicron 等變異株的演化速度,仍讓既有的研發節奏難以招架。這場全人類與病毒的生存競賽,也顯現了傳統生物製劑「研發速度慢、試錯成本高」的痛點。
如果當時已有今日 AI 技術的成熟度,疫情的劇本是否可能被重新改寫?
成立於舊金山的新創 DeepSeq,正試圖透過 AI 模型的訓練,建立一套能讀懂「蛋白質文法」的系統,讓藥物研發不再依賴大量盲目試錯,也讓未來的癌症治療、免疫疾病和傳染病預防,有機會變得更快、更精準。
什麼是蛋白質藥物?為何開發這麼困難?
所謂蛋白質藥物,又稱大分子藥物,是一種利用蛋白質之間的交互作用來治療疾病的藥物。
相較於一般藥局常見、以化學合成為主的阿斯匹靈或普拿疼等小分子藥物,蛋白質藥物的結構更龐大也更為複雜,通常需要透過注射方式使用。
人體內大多數的生理機制,其實都是依賴蛋白質彼此接觸、傳遞訊息。許多疾病的源頭,正是特定蛋白質發生異常所導致。因此,蛋白質藥物的核心概念,就是設計出能精準辨識目標的「對抗蛋白(抗體)」,去阻斷或破壞導致疾病的壞蛋白,進而延緩或抑制病程惡化。
例如,許多高齡者面臨的阿茲海默症,便與特定的壞蛋白,在腦中異常聚集成塊有關。這些壞蛋白會逐漸破壞神經元,導致認知與記憶功能退化。
由於蛋白質藥物具備高度「專一性」,能精準攻擊特定抗原,因此副作用通常相對較低。目前已被廣泛應用於癌症標靶治療、自體免疫疾病,以及傳染病的預防與治療。
但是蛋白質藥物的設計難度極高。
蛋白質是由 20 種胺基酸組成的立體結構,在龐大的排列組合中,只要其中一個胺基酸位置錯誤,就可能導致藥物完全無效,甚至引發免疫反應。這也使得傳統藥物研發如同大海撈針,不僅耗時數年,成本更動輒高達數十億美元。
從兆級數據除錯,找出能攻略疾病的最佳組合
為了能加速這類重症藥物的開發速度,DeepSeq 打造出一套能讀懂「蛋白質文法」的研發系統,試圖以 AI 重構蛋白質藥物的開發流程。
「構成蛋白質的 20 種胺基酸,其實就像英文字母,透過不同的排列組合,來形成不一樣的文法、語句。」DeepSeq 創辦人張淳傑(首圖中)表示,「只要能破解蛋白質的自然文法,我們就有機會設計出效果更好、副作用更低的藥物。」
其中,系統最大的核心優勢,在於 MI-LVL(Multi-Interaction Library versus Library)平台驚人的數據規模。
不同於一般實驗室只能在試管中測試數千到數萬種蛋白質組合,DeepSeq 的每項研究,都是直接從超過數十億、甚至高達數兆級的真實蛋白質交互作用數據中進行訓練與分析。
這樣的能力,讓 DeepSeq 能更早發現藥物可能產生的「脫靶(Off-target)」風險。也就是原本要攻擊 A 蛋白的藥物,卻意外影響到其他正常的 B、C 蛋白,進而引發的副作用、毒性或免疫反應。而得以在藥物設計初期就排除高風險的組合,降低後期臨床試驗的失敗的機率。
對生技產業而言,這不只是提升研發效率,更是在昂貴且高風險的藥物開發流程中,提前降低「最後一哩路」失敗的可能性。
目前,這項技術也展現出驚人的效率突破。
過去,初步藥物組合的篩選往往需要半年到一年時間,如今 DeepSeq 已能將流程縮短到 1 至 2 個月,讓整體研發速度提升近 10 倍。
「軟體先行驗證」找到市場突破口
DeepSeq 的誕生,源自創辦人張淳傑 (Andrew Chang) 對生技產業長年痛點的觀察。
張淳傑畢業於台大物理系,之後在美國密西根大學取得生物物理博士學位,並曾在全球知名生技大廠基因泰克(Genentech)從事研究。而長期身處藥物研發第一線,讓他深刻感受到傳統新藥開發流程的低效率,因此決定轉而創業,試圖用 AI 找出新解法。
在創業初期,由於缺乏資金添購昂貴的實驗設備,他選擇採取相對務實的「軟體先行」策略。他頻繁參與各類學術競賽與產業研討會,積極尋找願意為 AI 模型「半成品」買單的早期客戶,逐步驗證技術價值與市場需求。
也是在這段過程中,張淳傑陸續找到了兩位共同創辦人。包含專精蛋白質交互作用的生物學專家 Bernhard Suter(首圖右),以及擁有法律博士背景、曾任職於生技醫藥大廠安進(Amgen)並具備創投經驗的 Carey Chern(首圖左)。
如今,DeepSeq 已不只是單純提供 AI 系統的軟體公司,更建立起自己的實驗室,形成一套「AI 設計+實體驗證」的研發流程。
簡單來說,DeepSeq 會先透過 AI 平台設計出一批具有潛力的候選蛋白質序列,再進一步合成對應 DNA,植入自有細胞中,讓細胞如同「微型製藥工廠」般,自然生成實際的蛋白質藥物分子與至少上萬種不同受體(包含人體內天然蛋白和病原體)。
接著,研究團隊會讓這些蛋白質藥物與不同目標蛋白進行真實的物理接觸,包括疾病相關的癌細胞蛋白或病毒受體,以及人體中的好蛋白。透過觀察其親和力與作用反應,團隊不僅能判斷藥物是否有效、評估潛在副作用與脫靶風險,更能讓 AI 學習辨識什麼是好或壞的組合,提升對未來未知疾病與病原體的預測能力。相較於單純依靠電腦模擬,這種虛實整合的方式也大幅提升結果的可靠性。
由於科學家無法直接用肉眼辨識蛋白質序列,因此 DeepSeq 也會利用次世代定序(NGS)技術,回頭解析那些成功或失敗的 DNA 序列,再將這些真實世界的實驗結果,轉化為兆級規模的數據,重新餵回 MI-LVL 平台持續訓練。
透過這樣「實體驗證、數據回訓」的閉環流程,DeepSeq 得以持續優化模型,讓 AI 能更接近真實世界中的「蛋白質文法」。
諾貝爾獎掀起的 AI 製藥熱潮
目前,DeepSeq 的技術已獲得美國國防高等研究計劃署(DARPA)的相關資助,投資者名單更包含全球基因定序龍頭旗下的創投 Illumina Ventures 以及 Berkeley SkyDeck、Merck Digital Sciences Studio、Zaka VC 等,並與多家國際生技藥廠展開合作,期待透過降低藥物開發的風險,加速下一代精準醫療與重症藥物的誕生。
2024 年諾貝爾化學獎由生物化學家 David Baker、科學家 John M. Jumper 與 Google DeepMind 的共同創辦人暨執行長 Demis Hassabis 共同獲得,「這正好印證了 AI 語言模型在某種程度上,確實能夠捕捉蛋白質的文法規則、預測其立體結構。」張淳傑表示,這座獎項引爆了整個產業的熱潮,讓原本持觀望態度的藥廠與創投開始相信 AI 製藥的可能性,甚至連 OpenAI、Anthropic、Amazon 等科技巨頭也紛紛跨入這個領域。
「雖然理解蛋白質的三維結構是一項重大突破,但下一個更難的挑戰,是要真正讀懂蛋白質的『功能』。」張淳傑接著補充,「蛋白質的文法遠比人類語言複雜得多,要讓 AI 真正理解其語意與生物功能,我們所需要的數據量,是現有規模的數個量級之上,而這正是 DeepSeq 存在的意義。」
張淳傑最後提到,台灣也有許多優秀的 AI 人才與生物醫學基礎,他十分期待未來能在台灣找到相關領域的合作夥伴、看見更多 AI 於醫療與科學領域應用的發展。
團隊資訊
公司名稱:DeepSeq.AI, Inc.
成立年份:2019
新創資料庫|📮❗️我想聯絡創辦人