作為生物體的定向進化基本組成部分,蛋白質廣泛存在于人們生產生活中。國科3月22日,研人上海交通大學特聘教授洪亮團隊發布了蛋白質設計大模型Venus,布可白質其核心能力是讓蛋讓蛋白質實現功能的“定向進化”。該模型設計的模型多款產品已進入產業應用。
洪亮表示,定向進化自然界中參與構成蛋白質的國科氨基酸有20種,一個蛋白質分子一般由幾十個乃至數百個氨基酸組成,研人而蛋白質的布可白質功能則包含熱穩定性、活性、讓蛋親和力等。模型
洪亮團隊發布蛋白質設計大模型Venus(受訪者供圖)
據介紹,定向進化與以往靠經驗和高通量實驗的國科傳統方法相比,大模型Venus能完成蛋白質從序列到功能的研人預測,實現了從“大海撈針”到精準設計。如果想要強化目標蛋白質的某個功能,只需要提供該蛋白質的序列信息,Venus就可以快速給出一批蛋白質序列改造方案,隨后結合實驗驗證得到最優改造方案。
“數據是大模型的基礎,我們建立了包含數十億條蛋白質序列的數據集,覆蓋從常規地表生物到極端環境微生物的蛋白質序列信息,其中數億條蛋白質序列具有功能標簽。”洪亮說。
洪亮表示,基于海量功能未知的蛋白質數據集,精準發掘滿足苛刻應用需求的、具備超常規功能的蛋白質,是Venus的另一核心功能,有望開發這些蛋白質在生物技術、醫藥研發和工業生產中的應用潛力。
“蛋白質設計大模型的突破,不僅開辟了蛋白質從序列到功能的科學研究新方向,還打通了人工智能與生物交叉的工程化應用之路。”上海交通大學自然科學研究院院長金石說。
據介紹,Venus設計的多款蛋白質已進入產業化階段,例如活性高、穩定性強、產物純的PET降解酶,用于超敏檢測診斷的高活性堿性磷酸酶等。(記者董雪)