2023年7月,首屆國際基礎科學大會在北京隆重召開。知名計算生物學家、分子之心創始人、清華大學智能產業研究院(AIR)卓越訪問教授許錦波榮獲大會前沿科學獎。
首屆國際基礎科學大會由國際著名數學家丘成桐先生倡議發起,大會針對過去五年全球數學、物理、計算機與信息科學三大基礎科學領域發表的論文,由諾貝爾獎、菲爾茨獎、圖靈獎等國際大獎得主與世界各地的科學院院士共160多位評委共同評選出最具價值的研究成果,授予前沿科學獎。
許錦波教授作為《深度學習驅動的基于距離的蛋白質折疊》的唯一作者而獲得此項大獎。這項研究在全球范圍內首次將AI應用至蛋白質氨基酸(原子)之間的距離預測,進一步提升了蛋白質三維結構預測的精度,且讓科學家僅需使用筆記本電腦就能完成這項工作。該成果2019年發表于美國國家科學院院刊(PNAS),對AI蛋白質結構預測領域影響深刻,被廣泛應用于AI蛋白質建模、優化與設計中。
(相關資料圖)
當前,生物經濟正成為新經濟增長點,作為其底層基礎的蛋白質相關研究,也在AI的加持下提速爆發。解釋蛋白質的三維結構進而理解其功能,是理解生命機制的重要一步,也是藥物設計、合成生物學產品研發的重要基礎。但這一問題非常具有挑戰性,在過去近60年中,科學家們持續研究但進展緩慢。2016年,許錦波教授將AI方法引入蛋白質結構預測中,一舉實現了預測準確度的跨越式提升,為此后AlphaFold等方法的出現及蛋白質相關研究奠定了關鍵基礎。許錦波教授也因此被業界譽為“全球AI蛋白質折疊奠基人”。2019年,許錦波教授將研究范圍擴展至AI蛋白質優化與從頭設計,并將預訓練機制引入其中,進一步探索AI蛋白質技術的產業應用路徑。
近期,許錦波團隊在AI蛋白質結構設計領域進展頻頻。今年6月,發布了全球首創的可同時進行蛋白質側鏈預測和序列設計的AI算法《An end-to-end deep learning method for protein side-chain packing and inverse folding》,在精度、速度上取得大幅提升,并十分易用,這有利于它在工業領域被廣泛應用。同期,許錦波教授在國際權威學術期刊《科學》上發表了與基因測序巨頭Illumina 的聯合研究成果《The landscape of tolerated genetic variation in humans and primates》,用AI蛋白技術分析靈長類動物基因組的變異機制,為個性化基因醫學的發展夯實理論基礎。
在7月召開的2023世界人工智能大會(WAIC)上,許錦波領銜的分子之心團隊發布了業界首個AI蛋白質生成大模型“NewOrigin”(中文名“達爾文”), 瞄準創新藥設計、合成生物學等領域真實產業應用需求,用一個模型滿足蛋白質生成全流程需求,讓未來的大分子藥、新生物材料等蛋白質設計實現“一鍵定制”。
許錦波教授認為,相對于通用領域,大模型的價值或將在垂類領域先行爆發,尤其是蛋白質生成。蛋白質作為生命的語言,其氨基酸序列與自然語言類似,天然適用大語言模型,大模型有望將蛋白質設計從“編程時代”提升至“智能生成時代”。許錦波教授從2019年開始研究用大模型的方法,即預訓練機制改造和設計蛋白質,并持續取得突破?!爱斎唬鞍踪|序列形成的結構比自然語言的結構復雜得多,數據處理、AI算法、反饋機制等方面不能只是套用現有的大語言模型。但目前的階段性進展已經讓我們看到基于AI生成機制的大模型在蛋白質設計領域的潛力,相信AI蛋白質生成大模型是解決產業級蛋白質生成問題的有效路徑?!?
在持續推進AI算法創新的同時,分子之心也公布了多項經濕實驗驗證的AI從頭設計的蛋白質成果,如功能與天然蛋白類似但氨基酸數量更少的蛋白質,或是能與某個特定小分子結合的蛋白質、與某個特定底物結合的酶等。比如,許錦波團隊從頭設計的綠色熒光蛋白(GFP),僅用110個氨基酸就實現了與238個氨基酸的天然GFP蛋白相似的功能,并在首次濕實驗驗證中就獲得100%成功。
分子之心AI算法從頭設計的熒光酶和GFP蛋白
在藥物設計領域,許錦波團隊僅用幾小時就完成了傳統方法需要數月才能完成的抗體設計,并經濕實驗驗證成功得到多個候選抗體,這一結果對大分子藥物設計意義重大,意味著蛋白質從頭設計算法在抗體領域的可行性,未來可用基于AI的可編程、可預測方法替代傳統的“試錯”機制,針對特定的治療需求直接設計蛋白質藥物。甚至突破現有靶點的限制,從疾病源頭解決健康問題。
分子之心在AI蛋白質設計領域的技術突破,都將通過AI蛋白質預測、優化、設計平臺“MoleculeOS”服務于生物醫藥、合成生物學等產業領域。MoleculeOS是分子之心自研的業界首個功能完善的AI蛋白質預測、優化、設計平臺, 可面向真實產業需求提供解決方案,基于AI蛋白質技術解決藥物設計、生物育種、環境保護、高性能材料等領域的真實產業需求。
當下,生物科技的顛覆性變革已經開啟,未來,人類將能更加系統、全面地探索蛋白質宇宙中廣闊的未知領域,設計出新穎的、自然界中不存在的超級蛋白質,加速生物經濟時代到來。
關鍵詞: