一個密碼子對應一個氨基酸,但一個氨基酸可能對應多個密碼子,基因蛋白質表達量有所差異時可通過改變基因的密碼子來提高目的蛋白的表達量。隨著生命科學、生物技術的快速發展,人們對于機體生理生化機制認識更加深入,也為密碼子優化策略提供新的指導,泓迅生物為大家分享的是我司最新推出的密碼子優化升級版——密碼子優化2.0,快來了解一下吧!
密碼子優化策略
1. 密碼子偏向性
每一個宿主細胞會有一套自己的密碼子使用頻率表,在宿主細胞里,使用頻率高的密碼子(最佳密碼子)其對應的tRNA豐度高,由使用頻率高的密碼子組成的mRNA,其蛋白表達也會很高。密碼子適應指數CAI(Codon Adaption Index)指的是異源mRNA序列中密碼子和宿主細胞最佳密碼子使用頻率的相符程度,通常情況下,CAI≥0.80被認為是預測重組蛋白高效表達的標準,所以密碼子優化的最基本原則就是用宿主細胞中使用頻率高的同義密碼子去替換外源mRNA序列中密碼子,保證外源mRNA序列中的密碼子和宿主細胞的密碼子使用偏向性更加契合,避免稀有密碼子。
2. mRNA二級結構
mRNA二級結構是影響翻譯過程的重要因素,復雜穩定的二級結構會阻礙翻譯過程的順利進行,特別是核糖體綁定位點(RBS)附近的二級結構。mRNA二級結構在DNA序列中主要表現為發卡結構(Hairpin),有效識別并盡可能的減少發卡結構是密碼子優化軟件優劣的重要判斷標準。
3.GC含量
AT間存在2個氫鍵,GC間存在3個氫鍵,所以GC含量直接影響著DNA序列的結合穩定性和退火溫度。在啟動子等保守區域GC含量相對較高。另外,GC含量也影響著mRNA熱力學穩定性及mRNA二級結構。研究表明,GC含量大于70%會造成RNA二級結構穩定性增加,減慢或暫停翻譯;而GC含量小于30%,則會減慢轉錄延伸,也不利于蛋白表達。在真核生物中,還有一些對轉錄有重要影響的元件,如CpG島,TATA盒等重復序列,對序列的GC含量也非常重要。
泓迅生物密碼子優化2.0
泓迅生物圍繞密碼子偏好性、GC含量、串聯短重復序列、發夾結構等影響異源蛋白表達的因素進行算法設計,自主開發的NGTMCodon密碼子優化技術,可顯著提高原核蛋白的成功率和蛋白可溶性。
未經密碼子優化與密碼子優化2.0對比
1.蛋白R0103,分子量53.48kDa,未優化序列分別構建于pET-28a(+)載體,采用37℃及16℃兩種條件進行異源蛋白表達,未優化的序列未見目的蛋白表達,經過泓迅生物NGTMCodon密碼子優化2.0在37℃和16℃均有顯著目標蛋白表達。
2.蛋白R0118,分子量35.77kDa,未優化序列分別構建于pET-28a(+)載體,采用37℃及16℃兩種條件進行異源蛋白表達,未優化的序列未見目的蛋白表達,經過泓迅生物NGTMCodon密碼子優化2.0在37℃和16℃均有顯著目標蛋白表達,可溶性蛋白表達比例較高。
參考文獻
[1] Hongguang Fu, Yanbing Liang, Xiuqin Zhong, et al. Codon optimization with deep learning to enhance protein expression. Sci Rep. 2020. 10: 17617.
[2] Yi Liu, Qian Yang, and Fangzhou Zhao. Synonymous but not silent: the codon usage code for gene expression and protein folding. Annu Rev Biochem. 2021. 90: 375–401.