2024年諾貝爾化學獎授予戴維-貝克(David Baker)、戴米斯-哈薩比斯(Demis Hassabis)和約翰-朱伯(John M. Jumper),以表彰他們在蛋白質設計和結構預測領域做出的杰出貢獻。DeepMind團隊的AlphaFold3憑借其強大的結構預測統一框架,為藥物開發開辟了新的可能性,并有可能顛覆當前的藥物發現模式。
AI + 蛋白質市場規模
目前,對蛋白質的AI開發主要集中在預測蛋白質本身的結構和功能,預測蛋白質與其他生物大分子的相互作用,以及蛋白質設計和蛋白質組學分析等方面。在工業應用中,“AI+蛋白質設計 ”所占比例最高。目前,這些預測技術已更多地嵌入到現有的藥物開發和蛋白質工程流程中。
根據MedMarket Insights的數據,AI蛋白質市場規模在2023年達到14.83億美元,預計到2031年將增長到178億美元,復合年增長率約為36.5%,這主要得益于AI宏模型對生命科學的高度適應性。
數據來源: MedMarket Insights, 2023
從全球市場來看,美國是全球AI蛋白質研究和應用的領導者,約占市場份額的58%。歐洲占22%,亞洲(主要是中國和一些日本公司)約占12%的市場份額,英國和中東分別占4%和2%,其他地區占2%。
全球蛋白質AI市場分布預測
數據來源: MedMarket Insights, 2023
AI + 蛋白質應用場景
隨著以深度學習為代表的AI(AI)技術的發展,為蛋白質研究提供了另一種思路,帶來了方法、流程和思維的創新。特別是以 AlphaFold 為代表的突破性創新,AI在蛋白質結構預測、優化設計和組學研究方面取得了重大進展。同時,這些技術已經從實驗室走向實際應用,覆蓋了蛋白質設計、藥物發現、合成生物學等多個領域。
1、蛋白質設計
AI蛋白質設計可分為兩個主要方向:蛋白質優化和蛋白質從頭設計。
從功能到序列的蛋白質設計只需要確定能實現該功能的氨基酸序列。蛋白質優化涉及修改天然序列(定向進化)以增強其特定功能,如增強親和力、提高催化活性和穩定性。從零開始的蛋白質設計,包括從結構設計序列、從功能設計序列和從功能設計結構,這也是David Baker 教授及其團隊特別成功的領域。
2、藥物發現
AI蛋白質預測和蛋白質設計可以大大加快新藥研發的進程。通過預測蛋白質的結構和功能,模擬蛋白質與其他生物大分子的相互作用過程,可以準確確定藥物與靶點的結合位點,為藥物研發提供有力支持。此外,基于AI的端到端蛋白質設計技術可以實現從無到有,設計出具有特定功能的蛋白質類藥物。同時,將AI與蛋白質組學數據相結合,可以系統分析人體內蛋白質、疾病和藥物之間的關聯,補充靶點庫,加速藥物研發進程。
約85% 的人類疾病相關蛋白質靶點難以成為藥物,因為有些蛋白質難以分析和觀察,即使使用電子顯微鏡和核磁共振等傳統方法,也只能觀察到其靜態結構。AI技術為藥物發現和開發提供了新的工具和方法,以解決難以成藥的靶點,有望改變傳統的藥物發現模式,提高藥物發現的效率和成功率。
3、合成生物學
在合成生物學領域,通過精確控制和改變蛋白質的結構和功能,為農業、食品和制藥業提供了創新解決方案。這具有巨大的應用潛力和經濟價值。
在農業領域,AI可以改良作物蛋白質,提高產量和質量,減少環境污染。2021 年,NotCo 公司推出了AI平臺 Giuseppe,利用AI設計和預測植物性蛋白質的結構,模仿動物性食品中的營養成分和口感,為植物性食品的開發提供優化建議。
在食品領域,AI可以幫助開發營養更豐富、成本更低廉的優質蛋白質。合成生物學公司 Arzeda 在酶改性領域取得了重大成果,利用其先進的酶改性平臺開發出了可高效轉化甜味劑并降低生產成本的酶。此外,Arzeda 還為英國石油公司開發了新型酶,以提高石油開采和生產過程的效率。
如何將設計的蛋白質轉化為“實際功能蛋白質”?
1. 設計蛋白質
? 功能位點鑒定: 第一步是確定蛋白質的功能位點,該位點負責蛋白質的生化活性。
? 序列設計: 研究人員利用深度學習算法設計氨基酸序列,使其能折疊成包含所需功能位點的三維(3D)結構。這一步尤其具有挑戰性,因為它需要創建一個具有功能區(如活性位點或結合界面)的穩定的整體支架,并設計一個可折疊成該結構的序列。
2. 驗證和優化
? 性能驗證: 在進行實驗之前,要對設計的蛋白質進行計算驗證。這包括檢查蛋白質的穩定性,確保功能位點位置正確,并預測其與其他分子的相互作用。
? 優化: 在計算驗證的基礎上,設計可能會經過幾輪優化,以提高其穩定性、功能性和在生物系統中的表達。
3. 合成與表達
? 基因合成: 獲得優化的蛋白質序列后,下一步就是合成相應的基因。這可以通過DNA 合成技術來完成,目前這種技術已經高度自動化,而且效率很高。
? 蛋白表達: 然后將合成的基因克隆到合適的宿主細胞(如細菌、酵母或哺乳動物細胞)中進行蛋白質表達。在最佳條件下培養宿主細胞,以促進所需蛋白質的高水平表達。
4. 純化和表征
? 蛋白純化: 表達后,利用各種生化技術(如層析和電泳)從宿主細胞中純化蛋白質。這一步驟可確保蛋白質不含污染物和雜質。
? 表征分析:然后使用光譜、電泳和質譜等各種生物化學和生物物理方法對純化的蛋白質進行表征。這些方法可提供有關蛋白質結構、穩定性和功能特性的信息。
5. 蛋白功能測試
通過使用特定的檢測方法來測試蛋白質的功能特性,以測量其活性或與目標分子的結合親和力。這些檢測方法包括酶活性測量、結合實驗或細胞檢測。
泓迅生物
讓AI設計的蛋白質“活”起來
泓迅生物結合AI設計和合成生物學的力量,提供從蛋白質序列優化、表達到功能驗證的全面支持,促進蛋白質預測的下游應用研究,讓AI設計的蛋白質“活”起來。
AI-Drivern 深度 DNA 合成
Syno GS 平臺擁有多種智能生物分析工具,包括 Syno Ab、NG Codon、Complexity Index (CI) 和 AI-TAT。您只需提供想要合成的核苷酸或氨基酸序列,我們就會提供 100% 精確的基因序列,并克隆到您指定的載體中。精確的基因序列可以提高蛋白質表達的準確性和效率。
AI 驅動器深度 DNA 合成
實現從序列到結構再到功能的轉變
泓迅生物提供細菌、酵母、昆蟲和哺乳動物四種蛋白質表達系統選擇。從毫克到克,我們的合成生物學平臺和NG Condon 優化技術可生產出高純度的活性蛋白質,加速您的研究。根據蛋白質的性質和客戶的具體要求,我們從一系列表達載體、表達宿主和融合標簽中精心挑選,以提供最佳結果。我們為世界各地的科學家提供定制服務。
蛋白表達服務流程
助力抗體發現
AlphaFold 擅長預測蛋白質結構,但無法模擬蛋白質與其他蛋白質或藥物分子相互作用時的變化。泓迅生物的 Syno Ab 抗體平臺以 AlphaFold 預測的抗原結構為起點,解決了這一局限性。它以抗體生物醫學生物計算為支撐,有效模擬抗原-抗體對接,將計算技術與實驗方法相結合,幫助研究人員大幅降低抗體開發的總體成本,縮短開發周期。
服務流程
References
1.ABRAMSON, Josh, et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature, 2024, 1-3.
2.CHEN, Lingtao, et al. AI-Driven Deep Learning Techniques in Protein Structure Prediction. International journal of molecular sciences, 2024, 25.15: 8426.
3. GOEL, Divya; KUMAR, Ravi; KUMAR, Sudhir. AI-Assisted Methods for Protein Structure Prediction and Analysis. In: Microbial Data Intelligence and Computational Techniques for Sustainable Computing. Singapore: Springer Nature Singapore, 2024. p. 365-391.
4. Yoshida Hiroyuki,[Deep Learning and AlphaGo].[J] .Brain Nerve, 2019, 71: 681-694.
5. Niazi Sarfaraz K,Molecular Biosimilarity-An AI-Driven Paradigm Shift.[J] .Int J Mol Sci, 2022, 23.
6. Liu Z, Zhang Y, Nielsen J. Synthetic biology of yeast[J]. Biochemistry, 2019, 58(11): 1511-1520.