一個(gè)密碼子對(duì)應(yīng)一個(gè)氨基酸,但一個(gè)氨基酸可能對(duì)應(yīng)多個(gè)密碼子,基因蛋白質(zhì)表達(dá)量有所差異時(shí)可通過(guò)改變基因的密碼子來(lái)提高目的蛋白的表達(dá)量。隨著生命科學(xué)、生物技術(shù)的快速發(fā)展,人們對(duì)于機(jī)體生理生化機(jī)制認(rèn)識(shí)更加深入,也為密碼子優(yōu)化策略提供新的指導(dǎo),泓迅生物為大家分享的是我司最新推出的密碼子優(yōu)化升級(jí)版——密碼子優(yōu)化2.0,快來(lái)了解一下吧!
密碼子優(yōu)化策略
1. 密碼子偏向性
每一個(gè)宿主細(xì)胞會(huì)有一套自己的密碼子使用頻率表,在宿主細(xì)胞里,使用頻率高的密碼子(最佳密碼子)其對(duì)應(yīng)的tRNA豐度高,由使用頻率高的密碼子組成的mRNA,其蛋白表達(dá)也會(huì)很高。密碼子適應(yīng)指數(shù)CAI(Codon Adaption Index)指的是異源mRNA序列中密碼子和宿主細(xì)胞最佳密碼子使用頻率的相符程度,通常情況下,CAI≥0.80被認(rèn)為是預(yù)測(cè)重組蛋白高效表達(dá)的標(biāo)準(zhǔn),所以密碼子優(yōu)化的最基本原則就是用宿主細(xì)胞中使用頻率高的同義密碼子去替換外源mRNA序列中密碼子,保證外源mRNA序列中的密碼子和宿主細(xì)胞的密碼子使用偏向性更加契合,避免稀有密碼子。
2. mRNA二級(jí)結(jié)構(gòu)
mRNA二級(jí)結(jié)構(gòu)是影響翻譯過(guò)程的重要因素,復(fù)雜穩(wěn)定的二級(jí)結(jié)構(gòu)會(huì)阻礙翻譯過(guò)程的順利進(jìn)行,特別是核糖體綁定位點(diǎn)(RBS)附近的二級(jí)結(jié)構(gòu)。mRNA二級(jí)結(jié)構(gòu)在DNA序列中主要表現(xiàn)為發(fā)卡結(jié)構(gòu)(Hairpin),有效識(shí)別并盡可能的減少發(fā)卡結(jié)構(gòu)是密碼子優(yōu)化軟件優(yōu)劣的重要判斷標(biāo)準(zhǔn)。
3.GC含量
AT間存在2個(gè)氫鍵,GC間存在3個(gè)氫鍵,所以GC含量直接影響著DNA序列的結(jié)合穩(wěn)定性和退火溫度。在啟動(dòng)子等保守區(qū)域GC含量相對(duì)較高。另外,GC含量也影響著mRNA熱力學(xué)穩(wěn)定性及mRNA二級(jí)結(jié)構(gòu)。研究表明,GC含量大于70%會(huì)造成RNA二級(jí)結(jié)構(gòu)穩(wěn)定性增加,減慢或暫停翻譯;而GC含量小于30%,則會(huì)減慢轉(zhuǎn)錄延伸,也不利于蛋白表達(dá)。在真核生物中,還有一些對(duì)轉(zhuǎn)錄有重要影響的元件,如CpG島,TATA盒等重復(fù)序列,對(duì)序列的GC含量也非常重要。
泓迅生物密碼子優(yōu)化2.0
泓迅生物圍繞密碼子偏好性、GC含量、串聯(lián)短重復(fù)序列、發(fā)夾結(jié)構(gòu)等影響異源蛋白表達(dá)的因素進(jìn)行算法設(shè)計(jì),自主開(kāi)發(fā)的NGTMCodon密碼子優(yōu)化技術(shù),可顯著提高原核蛋白的成功率和蛋白可溶性。
未經(jīng)密碼子優(yōu)化與密碼子優(yōu)化2.0對(duì)比
1.蛋白R0103,分子量53.48kDa,未優(yōu)化序列分別構(gòu)建于pET-28a(+)載體,采用37℃及16℃兩種條件進(jìn)行異源蛋白表達(dá),未優(yōu)化的序列未見(jiàn)目的蛋白表達(dá),經(jīng)過(guò)泓迅生物NGTMCodon密碼子優(yōu)化2.0在37℃和16℃均有顯著目標(biāo)蛋白表達(dá)。
2.蛋白R0118,分子量35.77kDa,未優(yōu)化序列分別構(gòu)建于pET-28a(+)載體,采用37℃及16℃兩種條件進(jìn)行異源蛋白表達(dá),未優(yōu)化的序列未見(jiàn)目的蛋白表達(dá),經(jīng)過(guò)泓迅生物NGTMCodon密碼子優(yōu)化2.0在37℃和16℃均有顯著目標(biāo)蛋白表達(dá),可溶性蛋白表達(dá)比例較高。
參考文獻(xiàn)
[1] Hongguang Fu, Yanbing Liang, Xiuqin Zhong, et al. Codon optimization with deep learning to enhance protein expression. Sci Rep. 2020. 10: 17617.
[2] Yi Liu, Qian Yang, and Fangzhou Zhao. Synonymous but not silent: the codon usage code for gene expression and protein folding. Annu Rev Biochem. 2021. 90: 375–401.