什么是基因合成
基因合成是依照某一蛋白質(zhì)的基因序列,設(shè)計(jì)合成相互重疊的單鏈寡核苷酸,再通過重疊延伸PCR法拼接出全長(zhǎng),基因合成無需模板,是獲取基因的手段之一以提高在異源宿主的表達(dá)量行全基因合成,目前該技術(shù)主要應(yīng)用在基因的異源表達(dá)上,對(duì)基因密碼子優(yōu)化后進(jìn)。
此外,基因合成技術(shù)還用于合成一些不易獲取模板的基因或者自然界不存在的新基因等。基因合成技術(shù)可以按照人們的意愿設(shè)計(jì)且靈活地合成,正好符合了當(dāng)代生物學(xué)發(fā)展的潮流,將會(huì)在越來越多的領(lǐng)域得到應(yīng)用,并且發(fā)揮巨大的作用。
基因合成的方法主要有組裝PCR重疊延伸PCR、TBIO法、PTDS法等。困擾全基因合成技術(shù)的問題主要有2個(gè):①合成基因中堿基錯(cuò)誤率高。②合成成本高。
在基因合成前,為使基因在不同生物表達(dá)體系中都能得到良好表達(dá),研究人員通常會(huì)對(duì)基因進(jìn)行密碼子優(yōu)化。遺傳密碼有64種,但是絕大多數(shù)生物傾向于利用這些???碼子中的一部分,那些被最頻繁利用的稱為最佳密碼子,那些不被經(jīng)常利用的稱為稀有或利用率低的密碼子。
實(shí)際上用做蛋白表達(dá)或生產(chǎn)的每種生物(包括大腸桿菌,酵母,哺乳動(dòng)物細(xì)胞,植物細(xì)胞和昆蟲細(xì)胞)都表現(xiàn)出某種程度的密碼子偏愛性,因此,重組蛋白的表達(dá)可能受密碼子利用的影響(尤其在異源表達(dá)系統(tǒng)中)。
在不改變其編碼蛋白的情況下,對(duì)一個(gè)蛋白的編碼基因進(jìn)行改變,去除稀有密碼子,合理優(yōu)化其mRNA二級(jí)結(jié)構(gòu),GC含量等的過程叫密碼子優(yōu)化。密碼子優(yōu)化的原理即根據(jù)將要使用的表達(dá)系統(tǒng)的密碼子偏愛性,針對(duì)目標(biāo)蛋白序列中的每一個(gè)氨基酸選擇不同的密碼子進(jìn)行全序列的組合,找出其中*的一條。
1、引物合成
研究人員根據(jù)自己的意愿確定合成的基因序列后,由于沒有模板,首先需根據(jù)待合成的雙鏈DNA設(shè)計(jì)引物、合成引物。引物,又名引子,是一小段單鏈DNA或RNA,作為DNA復(fù)制的起始點(diǎn),在核酸合成反應(yīng)時(shí),作為每個(gè)多核苷酸鏈進(jìn)行延伸的出發(fā)點(diǎn)而起作用的多核苷酸鏈。
在PCR(聚合酶鏈?zhǔn)椒磻?yīng))技術(shù)中,已知一段目的基因核苷酸序列,根據(jù)這一序列合成引物,利用PCR擴(kuò)增技術(shù),目的基因DNA受熱變性后解鏈為單鏈,引物與單鏈相應(yīng)互補(bǔ)序列結(jié)合,然后在DNA聚合酶作用下進(jìn)行延伸,如此重復(fù)循環(huán),延伸后得到的產(chǎn)物同樣可以和引物結(jié)合。
簡(jiǎn)單地說,引物即是短的單鏈DNA或短的RNA鏈,序列長(zhǎng)度一般為15~90nt(nt為引物堿基單位,有些也用nt或bp標(biāo)識(shí)),一般不超過120nt。目前引物合成基本采用固相亞磷酰胺三酯法。亞磷酰胺三酯法合成DNA片段,具有高效、快速的偶聯(lián)以及起始反應(yīng)物比較穩(wěn)定的特點(diǎn)。亞磷酰胺三酯法是將DNA偶聯(lián)在固相載體上完成DNA鏈的合成的,引物合成的方向依據(jù)既定引物序列由3'端向5'端延伸,相鄰的核苷酸通過3'→5'磷酸二酯鍵連接。
2、引物互為模板PCR擴(kuò)增
引物合成后,引物之間互為模板進(jìn)行PCR擴(kuò)增。PCR技術(shù)的基本原理類似于DNA的天然復(fù)制過程,其特異性依賴于與靶序列兩端互補(bǔ)的寡核苷酸引物。
PCR由變性-退火-延伸三個(gè)基本反應(yīng)步驟構(gòu)成:
①模板DNA的變性:模板DNA經(jīng)加熱至93℃左右一定時(shí)間后,使模板DNA雙鏈或經(jīng)PCR擴(kuò)增形成的雙鏈DNA解離,使之成為單鏈,以便它與引物結(jié)合,為下輪反應(yīng)作準(zhǔn)備;
②模板DNA與引物的退火(復(fù)性):模板DNA經(jīng)加熱變性成單鏈后,溫度降至55℃左右,引物與模板DNA單鏈的互補(bǔ)序列配對(duì)結(jié)合;
③引物的延伸:DNA模板-引物結(jié)合物在TaqDNA聚合酶的作用下,以dNTP為反應(yīng)原料,靶序列為模板,按堿基配對(duì)與半保留復(fù)制原理,合成一條新的與模板DNA鏈互補(bǔ)的半保留復(fù)制鏈。
重復(fù)循環(huán)變性-退火-延伸三過程,就可獲得更多的“半保留復(fù)制鏈”,而且這種新鏈又可成為下次循環(huán)的模板。每完成一個(gè)循環(huán)需2~4分鐘,2~3小時(shí)就能將待擴(kuò)目的基因擴(kuò)增放大幾百萬倍。
3、連接轉(zhuǎn)化、菌檢送測(cè)
通過PCR反應(yīng),可擴(kuò)增出我們需要的雙鏈DNA。但PCR產(chǎn)物穩(wěn)定性較低,我們需將連接到質(zhì)粒上,轉(zhuǎn)化進(jìn)感受態(tài)中,涂平板過夜培養(yǎng)。第二天早上就可以從平板中挑選陽(yáng)性克隆,挑到的克隆需要再次使用菌落PCR驗(yàn)證是否有全長(zhǎng)的基因插入,使用首尾引物進(jìn)行PCR,如果有產(chǎn)物,說明有目的基因。將驗(yàn)證過的克隆轉(zhuǎn)化進(jìn)入試管培養(yǎng)搖菌,之后,抽提質(zhì)粒,純化送去進(jìn)行測(cè)序。
4、一代測(cè)序
目前,我們采用的是一代測(cè)序,也叫sanger測(cè)序。Sanger法測(cè)序利用一種DNA聚合酶來延伸結(jié)合在待定序列模板上的引物,直到摻入一種鏈終止核苷酸為止。每一次序列測(cè)定由一套四個(gè)單獨(dú)的反應(yīng)構(gòu)成,每個(gè)反應(yīng)含有所有四種脫氧核苷酸三磷酸(dNTP),并混入*的一種不同的雙脫氧核苷三磷酸(ddNTP)。
由于ddNTP缺乏延伸所需要的3-OH基團(tuán),使延長(zhǎng)的寡聚核苷酸選擇性地在G、A、T或C處終止。終止點(diǎn)由反應(yīng)中相應(yīng)的雙脫氧而定。每一種dNTPs和ddNTPs的相對(duì)濃度可以調(diào)整,使反應(yīng)得到一組長(zhǎng)幾百至幾千堿基的鏈終止產(chǎn)物。
它們具有共同的起始點(diǎn),但終止在不同的核苷酸上,可通過高分辨率變性凝膠電泳分離大小不同的片段,凝膠處理后可用X-光膠片放射自顯影或非同位素標(biāo)記進(jìn)行檢測(cè)。
5、QC驗(yàn)證
將測(cè)序結(jié)果與目標(biāo)基因進(jìn)行比對(duì),同時(shí)進(jìn)行QC酶切驗(yàn)證,如果測(cè)序結(jié)果與酶切驗(yàn)證結(jié)果均正確,就完成目的基因的合成了。按照上述步驟,順利的情況下5天時(shí)間就能合成出一段800bp左右的基因序列。
目前,基因合成周期短,同時(shí)可以保證序列的100%正確無誤,具有很大的靈活性,可以對(duì)基因的酶切位點(diǎn)和基因序列進(jìn)行修改,方便下游的克隆和實(shí)驗(yàn);研究人員根據(jù)自己的意愿設(shè)計(jì)得到自然界中很難獲得甚至不存在的基因;基因合成的基因可以進(jìn)行密碼子優(yōu)化,使基因在各種生物表達(dá)體系中都能得到良好表達(dá)。
這些優(yōu)點(diǎn)使得基因合成在生物領(lǐng)域有著廣泛應(yīng)用,比如克隆人鼠抗體或重組抗體、合成不同的基因突變株、SNPS或其他突變株、設(shè)計(jì)合成DNA疫苗、大量合成用于微芯片的cDNA等。基因合成技術(shù)的發(fā)展使生物領(lǐng)域又上了一個(gè)新臺(tái)階。
基因合成產(chǎn)業(yè)
美國(guó)基因合成產(chǎn)業(yè)發(fā)達(dá),有賴于發(fā)達(dá)的生物產(chǎn)業(yè),政府與企業(yè)在基因業(yè)務(wù)上投入比較大,而國(guó)內(nèi)大批量投入的科研產(chǎn)業(yè)少,基因合成市場(chǎng)有限,客戶主要是科研單位。未來中國(guó)的基因合成產(chǎn)業(yè),很大程度上受到國(guó)家對(duì)生物產(chǎn)業(yè)的政策引導(dǎo)的影響。
國(guó)外分析機(jī)構(gòu)的數(shù)據(jù)顯示,2014年全球包括工業(yè)級(jí)和科研級(jí)在內(nèi)的合成基因市場(chǎng)規(guī)模為20億美元,其中中國(guó)1.2億美元,僅占6%。這個(gè)小數(shù)據(jù)表明,國(guó)內(nèi)生物產(chǎn)業(yè)自己研發(fā)的東西太少,大部分國(guó)內(nèi)生物制藥企業(yè),還是持續(xù)依靠復(fù)制國(guó)外技術(shù),甚至等技術(shù)過期后直接拿來用,這樣并不需要合成基因。
因?yàn)楹铣苫蛑挥性谇捌谘邪l(fā)的時(shí)候才有較大的應(yīng)用空間,如果研發(fā)投入少,基因合成出來沒有消耗的市場(chǎng),投入相應(yīng)就會(huì)小很多。國(guó)內(nèi)生物制藥企業(yè)長(zhǎng)期只是模仿,路會(huì)越走越窄,發(fā)展到一定程度就會(huì)遇到很大的瓶頸。
從另一方面看,各國(guó)的生物產(chǎn)業(yè)都受到一定的限制,這是由行業(yè)特征決定的:生物產(chǎn)業(yè)是一個(gè)長(zhǎng)期投入、高投入、成功率不高的產(chǎn)業(yè),不像其他行業(yè)那樣能更快地產(chǎn)業(yè)化。
經(jīng)過十幾年的發(fā)展,整個(gè)基因合成行業(yè)已經(jīng)很成熟,然而,也引發(fā)了一系列行業(yè)問題。由于進(jìn)入門檻低、競(jìng)爭(zhēng)無序,國(guó)內(nèi)企業(yè)不得不憑借國(guó)內(nèi)人力成本低的優(yōu)勢(shì),趨向到國(guó)外接單、國(guó)內(nèi)合成的業(yè)務(wù)。
基因合成入行門檻不高,一些小的公司買一臺(tái)儀器,三四個(gè)人就可以從事這項(xiàng)工作,一個(gè)人去跑市場(chǎng),攢夠訂單后就能開機(jī)。
基因合成行業(yè)拼的主要是儀器的通量。企業(yè)開機(jī)一次合成低于1000條BP是虧錢的,大規(guī)模、大通量才可以降低成本。
擠入這個(gè)行業(yè)者眾多,但基因合成技術(shù)還處于1.0版本,合成能力有限、合成周期較長(zhǎng)、通量不高,因此,成本高。合成價(jià)格對(duì)于需求方而言仍然昂貴,也是國(guó)內(nèi)基因合成產(chǎn)業(yè)發(fā)展緩慢的主因之一。
電話
微信掃一掃