獲美國防部 DARPA 資助！DeepSeq 用「蛋白質語言模型」，挑戰重症藥物開發難題

2020 年起，全球陷入了長達 3 年的 COVID-19 疫情時代，當時各國無不積極投入疫苗與蛋白質藥物的開發，但 Omicron 等變異株的演化速度，仍讓既有的研發節奏難以招架。這場全人類與病毒的生存競賽，也顯現了傳統生物製劑「研發速度慢、試錯成本高」的痛點。

如果當時已有今日 AI 技術的成熟度，疫情的劇本是否可能被重新改寫？

成立於舊金山的新創 DeepSeq，正試圖透過 AI 模型的訓練，建立一套能讀懂「蛋白質文法」的系統，讓藥物研發不再依賴大量盲目試錯，也讓未來的癌症治療、免疫疾病和傳染病預防，有機會變得更快、更精準。

什麼是蛋白質藥物？為何開發這麼困難？

所謂蛋白質藥物，又稱大分子藥物，是一種利用蛋白質之間的交互作用來治療疾病的藥物。

相較於一般藥局常見、以化學合成為主的阿斯匹靈或普拿疼等小分子藥物，蛋白質藥物的結構更龐大也更為複雜，通常需要透過注射方式使用。

人體內大多數的生理機制，其實都是依賴蛋白質彼此接觸、傳遞訊息。許多疾病的源頭，正是特定蛋白質發生異常所導致。因此，蛋白質藥物的核心概念，就是設計出能精準辨識目標的「對抗蛋白（抗體）」，去阻斷或破壞導致疾病的壞蛋白，進而延緩或抑制病程惡化。

例如，許多高齡者面臨的阿茲海默症，便與特定的壞蛋白，在腦中異常聚集成塊有關。這些壞蛋白會逐漸破壞神經元，導致認知與記憶功能退化。

由於蛋白質藥物具備高度「專一性」，能精準攻擊特定抗原，因此副作用通常相對較低。目前已被廣泛應用於癌症標靶治療、自體免疫疾病，以及傳染病的預防與治療。

但是蛋白質藥物的設計難度極高。

蛋白質是由 20 種胺基酸組成的立體結構，在龐大的排列組合中，只要其中一個胺基酸位置錯誤，就可能導致藥物完全無效，甚至引發免疫反應。這也使得傳統藥物研發如同大海撈針，不僅耗時數年，成本更動輒高達數十億美元。

從兆級數據除錯，找出能攻略疾病的最佳組合

為了能加速這類重症藥物的開發速度，DeepSeq 打造出一套能讀懂「蛋白質文法」的研發系統，試圖以 AI 重構蛋白質藥物的開發流程。

「構成蛋白質的 20 種胺基酸，其實就像英文字母，透過不同的排列組合，來形成不一樣的文法、語句。」DeepSeq 創辦人張淳傑（首圖中）表示，「只要能破解蛋白質的自然文法，我們就有機會設計出效果更好、副作用更低的藥物。」

其中，系統最大的核心優勢，在於 MI-LVL（Multiplex Interaction - Library versus Library）平台驚人的數據規模。

不同於一般實驗室只能在試管中測試數千到數萬種蛋白質組合，DeepSeq 的每項研究，都是直接從超過數十億、甚至高達數兆級的真實蛋白質交互作用數據中進行訓練與分析。

這樣的能力，讓 DeepSeq 能更早發現藥物可能產生的「脫靶（Off-target）」風險。也就是原本要攻擊 A 蛋白的藥物，卻意外影響到其他正常的 B、C 蛋白，進而引發的副作用、毒性或免疫反應。而得以在藥物設計初期就排除高風險的組合，降低後期臨床試驗的失敗的機率。

對生技產業而言，這不只是提升研發效率，更是在昂貴且高風險的藥物開發流程中，提前降低「最後一哩路」失敗的可能性。

目前，這項技術也展現出驚人的效率突破。

過去，初步藥物組合的篩選往往需要半年到一年時間，如今 DeepSeq 已能將流程縮短到 1 至 2 個月，讓整體研發速度提升近 10 倍。

「軟體先行驗證」找到市場突破口

DeepSeq 的誕生，源自創辦人張淳傑 (Andrew Chang) 對生技產業長年痛點的觀察。

張淳傑畢業於台大物理系，之後在美國密西根大學取得生物物理博士學位，並曾在全球知名生技大廠基因泰克（Genentech）從事研究。而長期身處藥物研發第一線，讓他深刻感受到傳統新藥開發流程的低效率，因此決定轉而創業，試圖用 AI 找出新解法。

在創業初期，由於缺乏資金添購昂貴的實驗設備，他選擇採取相對務實的「軟體先行」策略。他頻繁參與各類學術競賽與產業研討會，積極尋找願意為 AI 模型「半成品」買單的早期客戶，逐步驗證技術價值與市場需求。

也是在這段過程中，張淳傑陸續找到了兩位共同創辦人。包含專精蛋白質交互作用的生物學專家 Bernhard Suter（首圖右），以及擁有法律博士背景、曾任職於生技醫藥大廠安進（Amgen）並具備創投經驗的 Carey Chern（首圖左）。

如今，DeepSeq 已不只是單純提供 AI 系統的軟體公司，更建立起自己的實驗室，形成一套「AI 設計＋實體驗證」的研發流程。

簡單來說，DeepSeq 會先透過 AI 平台設計出一批具有潛力的候選蛋白質序列，再進一步合成對應 DNA，植入自有細胞中，讓細胞如同「微型製藥工廠」般，自然生成實際的蛋白質藥物分子與至少上萬種不同受體（包含人體內天然蛋白和病原體）。

接著，研究團隊會讓這些蛋白質藥物與不同目標蛋白進行真實的物理接觸，包括疾病相關的癌細胞蛋白或病毒受體，以及人體中的好蛋白。透過觀察其親和力與作用反應，團隊不僅能判斷藥物是否有效、評估潛在副作用與脫靶風險，更能讓 AI 學習辨識什麼是好或壞的組合，提升對未來未知疾病與病原體的預測能力。相較於單純依靠電腦模擬，這種虛實整合的方式也大幅提升結果的可靠性。

DeepSeq 蛋白質交互作用藥物與病毒、癌細胞在數位世界中交互作用的縮影。中間密密麻麻的「連線」代表抗體與抗原之間的結合，而線條越粗，代表親和力越強。 DeepSeq

由於科學家無法直接用肉眼辨識蛋白質序列，因此 DeepSeq 也會利用次世代定序（NGS）技術，回頭解析那些成功或失敗的 DNA 序列，再將這些真實世界的實驗結果，轉化為兆級規模的數據，重新餵回 MI-LVL 平台持續訓練。

透過這樣「實體驗證、數據回訓」的閉環流程，DeepSeq 得以持續優化模型，讓 AI 能更接近真實世界中的「蛋白質文法」。

諾貝爾獎掀起的 AI 製藥熱潮

目前，DeepSeq 的技術已獲得美國國防高等研究計劃署（DARPA）的相關資助，投資者名單更包含全球基因定序龍頭旗下的創投 Illumina Ventures 以及 Berkeley SkyDeck、Merck Digital Sciences Studio、Zaka VC 等，並與多家國際生技藥廠展開合作，期待透過降低藥物開發的風險，加速下一代精準醫療與重症藥物的誕生。

2024 年諾貝爾化學獎由生物化學家 David Baker、科學家 John M. Jumper 與 Google DeepMind 的共同創辦人暨執行長 Demis Hassabis 共同獲得，「這正好印證了 AI 語言模型在某種程度上，確實能夠捕捉蛋白質的文法規則、預測其立體結構。」張淳傑表示，這座獎項引爆了整個產業的熱潮，讓原本持觀望態度的藥廠與創投開始相信 AI 製藥的可能性，甚至連 OpenAI、Anthropic、Amazon 等科技巨頭也紛紛跨入這個領域。

「雖然理解蛋白質的三維結構是一項重大突破，但下一個更難的挑戰，是要真正讀懂蛋白質的『功能』。」張淳傑接著補充，「蛋白質的文法遠比人類語言複雜得多，要讓 AI 真正理解其語意與生物功能，我們所需要的數據量，是現有規模的數個量級之上，而這正是 DeepSeq 存在的意義。」

張淳傑最後提到，台灣也有許多優秀的 AI 人才與生物醫學基礎，他十分期待未來能在台灣找到相關領域的合作夥伴、看見更多 AI 於醫療與科學領域應用的發展。