1. 無縫克隆引物不含酶切位點設計原理
無縫克隆,讓載體構建變得像搭積木一樣簡單
吳思涵
知芹余擾識星球「生物狗窩」,生物醫學同行交流社區
前言
提起「克隆」、「載體構建」這兩個詞,似乎總會同時提到「限制性內切酶」。沒錯,在過去數十年,用限制性內切酶產生黏性末端,並通過鹼基互補配對,連接兩個甚至更多片段的克隆方法,是載體構建的經典方案。
近年嫌旦來,「無縫克隆」逐漸受到科學家的歡迎。相比之下,無縫克隆操作更加簡單,靈活性更強,同時幾乎不受序列的限制,一次可定向組裝高達10個片段的dsDNA。這篇文章將帶大家認識無縫克隆的原理、優勢和應用。
一、無縫克隆的原理
首先要強調的是,無縫克隆有兩個主要的流派:Gibson assembly和Golden Gate assembly。由於Golden Gate assembly依賴於Type IIS限制性DNA內切酶(如BsaI,BbsI等),一旦載體不攜帶相應的識別序列,這種方法就走不通了。而假設通過PCR引入Type IIS內切酶識別序列,那便不是真毀宴正意義上的「無縫」了。因此本文所提的「無縫克隆」,特指Gibson assembly流,不涉及任何Golden Gate及其他流派。
目前,無縫克隆比較著名的商品化名字有NEB家的Gibson Assembly和NEBuilder HiFi DNA Assembly,Clontech家的In-Fusion,以及Invitrogen家的GeneArt等。但無論叫什麼名字,其基本原理都和早期的Gibson assembly的是一樣的。
與傳統的雙酶切克隆一般,無縫克隆同樣需要依賴於dsDNA的黏性末端進行互補配對,並利用DNA連接酶催化形成磷酸二酯鍵修復缺口(nick)。但是,無縫克隆並不使用「內切酶」來製造黏性末端,而是通過「外切酶」來產生的。
(Tips 1:「內切酶」是在核酸鏈內部進行「一刀兩斷」剪切的酶,而「外切酶」是在核酸鏈的末端、即外部進行「逐個鹼基」剪切的酶)
在無縫克隆中使用的外切酶是T5核酸外切酶,它能沿著5』→3』方向,降解dsDNA,從而產生黏性末端。
(Tips 2:T5外切酶同時具有ssDNA外切酶活性,但並不降解超螺旋dsDNA。)
讀到這里大家應該能想到,假設要拼接的兩個片段的末端,是一模一樣的鹼基序列,那麼通過T5外切酶,就能產生幾乎一致的黏性末端了。沒錯,無縫克隆的原理便是如此。如下圖所示,假如我們需要將3個片段按照1→2→3的順序拼接起來,只需要保證1的末尾和2的開頭,以及2的末尾和3的開頭,具有同樣的序列即可(我們可稱之為同源臂)。這個同源臂序列,並不是額外添加進去的,而是載體或者拼接片段本身攜帶的。也就是說,我們可以通過PCR的方法,在外源拼接片段的兩端加上線性化載體
2. 基因克隆
基因克隆(gene cloning)或分子克隆,又稱為重組DNA技術,是應用酶學方法,在體外將不同來源的DNA分子通過酶切、連接等操作重新組裝成雜合分子,並使之在適當的宿主細胞中進行擴增,形成大量的子代DNA分子的過程。例如,要獲得人類基因組中的某個基因,我們就需要藉助基因克隆技術,進行目的基因的分離、克隆和擴增。因此,接下來,我就從基因克隆工具和具體的實驗流程兩方面進行介紹。
( 1 )限制性內切酶
首先介紹的是限制性核酸內切酶,它是細菌的「限制-修飾系統」防禦機制的重要一員。限制修飾系統(Restriction-Modification System, R-M system ),即限制酶和甲基化酶系統(圖1) [1]。研究者將能識別並切斷外來DNA分子的某些部位,使外來DNA失去活性,限制外來噬菌體的繁殖的酶稱為 限制性核酸內切酶 (Restriction endonuclease,RE,簡稱限制性內切酶或限制酶)。而宿主細菌的DNA通過甲基化酶的甲基化後,DNA的酶切位點被保護起來,不會被限制酶切割。
根據限制性內切酶的結構,識別位點,切割位點等特性可以將RE分成四類(表1)[2],基因克隆中常用的是II型限制性內切酶。不過像IV型內切酶這種可以識別修飾化DNA,可以用於表觀遺傳學的研究。
II型限制性內切酶是目前發現的最多的一類內切酶,根據其識別位點與切割位點的特性又可以分成不同的亞型[3],例如我們常見的識別迴文序列的內切酶, Eco R I,屬於Type IIP類型,這種酶的切割位點在畝陪識別位點內部;而像現在在CRISPR/Cas9相關基因克隆中用到的 Bpi I等酶,則屬於Type IIS型,它的切割位點離識別位點有幾個到幾十個鹼基的距離。
既然是迅沒蠢限制性內切酶,那麼酶切DNA後就會留下不同的末端類型,這其中就包括粘性末端和平末端(圖3)。所謂的粘性末端,就是酶切後有5』端或者3』端有突出鹼基的末端類型,因此又分為5』 Overhang end,例如 Hin d III,和3』 Overhang end, 例如 Pst I兩種。那些酶切後沒有突出鹼基的就屬於平末端類型, 例如 Eco R V。
DNA鹼基之間靠5』, 3』 磷酸二酯鍵連接,限制性內切酶切割DNA後,出現的是5』-P 和3』-OH(圖4)。
另外,根據限制性內切酶的功能,其又有同裂酶、異裂酶、同尾酶、可變酶和修飾敏感內切酶等類型(圖5)。其中,同裂酶(isoschizomer),又稱異源同工酶,即從不同原核生物中分離出來的不同的Ⅱ型酶,有相同的識別特點和切割位點,例如 Age I和 Bsh T I。異裂酶則是指可以識別相同的核苷酸序列,但會在不同的位點切割 DNA,例如 Sma I和 Xma I。同尾酶(isocaudarmer)指不同來源的酶其識別和切割序列有一定的相關性,作用後能產生相同的粘性末端,例如 Age I和 Xma I,這一類的酶酶切後的產物可以進行連接,在基因克隆中有著重要的用途。可變酶則指所識別DNA序列中的一個或幾個鹼基是可變的,並且識別序列往往超過6個察消鹼基對,例如 Bst E II識別序列為:GGTNACC,其中N為一可變鹼基,可以是A/T/C/G四種中的任何一個;而 Bst N I 的識別序列為CCWGG,其中的W則表示A或者T。修飾敏感內切酶是對DNA修飾(例如甲基化修飾)敏感的限制性內切酶,例如 Bcl I對甲基化的識別位點不能切割,但無甲基化的則可以進行切割; Dpn I則剛好相反,有甲基化才能切割。
限制性內切酶有那麼多種,到底選擇那種進行呢?
首先,我們需要進行酶切位點分析,可以使用在線( Sequence Manipulation Suite 和 analyze-sequence, Addgene )或者本地版(SnapGene)的分析工具進行序列分析。然後結合同裂酶、異裂酶、同尾酶、可變酶特性進行RE選擇,並且同時要考慮所選限制性內切酶對修飾敏感性。另外,根據試劑使用中使用的酶的數量,我們將酶切反應可以分為單酶切、雙酶切和分步酶切。 單酶切 :同一個體系進行一種酶切反應; 雙酶切 :同一個體系進行兩種酶的酶切反應(針對反應條件一致的限制性內切酶); 分步酶切 :樣品進行完第一個酶切反應後進行純化,再進行第二個酶切反應(針對反應條件不一樣的限制性內切酶)。明確了以上信息後,我們就可以進行酶切反應了。一個酶切反應涉及樣品類型,緩沖液,酶量以及反應溫度和反應時間等。這些都可以參考限制性內切酶的產品使用說明進行操作。
( 2 ) DNA 連接酶
限制性內切酶負責將DNA切開,DNA連接酶則是用來重新連接DNA的工具。DNA連接酶是一類催化雙鏈DNA中相鄰鹼基的5』磷酸和3』羥基間磷酸二酯鍵形成的酶(圖6)。因為是雙鏈,所以一般要求連接位點不能出現鹼基錯配。不過實際應用中,DNA連接酶也會將有少量錯配的DNA進行連接。DNA連接酶主要有兩種:T4 DNA連接酶(平末端和粘性末端均可連接),大腸桿菌DNA連接酶(只能連接粘性末端)。
( 3 ) DNA 聚合酶
之前我們介紹過PCR聚合酶鏈式反應,其中使用的就是DNA聚合酶。實際上,DNA聚合酶長具備三種酶活性(圖7):用於新鏈DNA合成的DNA聚合酶活性,用於錯誤參入鹼基校正的3』-5』核酸外切酶活性,還有5』-3』 核酸外切酶活性,在DNA復制中用於去除RNA 引物。藉助這一活性,可以進行Nick translation,用於標記核苷酸參入等。但並不是每一種DNA聚合酶都這三種酶活性,NEB官網提供了一系列DNA聚合酶及其具備的功能活性( DNA Polymerase Selection Chart-NEB )。
根據所使用的DNA聚合酶類型不同,PCR產物的末端有3』-A粘性末端和平末端兩種類型。其中Taq DNA polymerase因為缺乏3』-5』 exonuclease活性,其PCR的保真度低,且PCR產物的3』端多一個粘性末端A;而 高保真DNA polymerase保留3』-5』 exonuclease活性,有很高的校正活性,其PCR產物為平末端。
( 4 )無縫克隆技術
除了上面介紹的用於傳統基因克隆中國的相關工具外,研究者開發了新型的基於插入片段和線性化載體的末端進行同源重組的基因克隆技術,即無縫克隆技術(Seamless Cloning),主要包括Gibson Assembly[4]和Getway Clone兩種。這里我們重點介紹其中的Gibson Assembly。
Gibson Assembly技術包含了DNA 5' 外切酶(5' Exonuclease)、DNA聚合酶(DNA Polymerase)和DNA連接酶(DNA Ligase)活性的重組酶(assembly enzyme),通過同源重組的方法可以將一個或多個DNA片段按照預定方向、快速、高效和精確地插入到線性化載體中,並且最終構建的克隆沒有任何額外的鹼基序列,因此被稱作「無縫克隆」。如圖9中Gibson Assembly所示,紅色和綠色2個片段為需要連接的雙鏈DNA片段,它們末端有相同的15-25個重疊序列(黑色),首先在50℃條件下,T5 exonuclease核酸外切酶降解5』端的一些鹼基,形成3』端突出的單鏈,3』端單鏈互補退火;然後Phusion高保真聚合酶補上兩條單鏈之間的缺口;最後Taq DNA ligase將相鄰的單鏈切口連接補齊形成完整的DNA雙鏈(圖6)。
在Gibson Assembly基礎上,研究者開發了TEDA[5],僅添加T5 exonuclease核酸外切酶同樣可以實現重組克隆,它與藉助細胞體內的DNA修復機制進行缺損DNA的修復(圖6)。
( 5 )工具載體
接下來我們介紹基因克隆中常用的工具載體。按照功能分,載體分為克隆載體和表達載體(表2)。其中克隆載體含有能在原核細胞中復制的元件,用來克隆和擴增基因;表達載體除了具備克隆載體的基本元件外,還具有轉錄/翻譯所必須的DNA順式元件。以下,我們將以SnapGene或addgene分析的載體結構圖進行相關功能元件的說明。
以pUC19為例,說明克隆載體中的功能元件(圖10)。
復制起始位點( Origin of replication , ORI ): ORI是一段DNA序列,質粒復制的起始位置。DNA解螺旋酶可以作用於這段序列,然後DNA的雙鏈被分開,復制隨即開始。質粒必須是能夠復制的,否則隨著細菌的生長,質粒的數量將會被迅速稀釋。 篩選標記,主要指抗生素抗性基因。 在含有抗生素的培養基中培養細菌,能夠生長的就是含有目的質粒,因為,不含質粒的細菌已經被「殺死」了,原核中常用的抗性篩選基因有Amp和Kan。 Lac Z :β-半乳糖苷酶基因,也是一種篩選標記,用於藍白斑篩選。 多克隆位點( multiple cloning site, MCS ), 這是一段短DNA片段,包括多個限制性酶切的單一位點,便於外源基因的插入。一般來說,外源DNA片段越長,越難插入,越不穩定,轉化效率越低。
以pcDNA3.1為例,說明表達載體中的功能元件(圖11)。
表達載體pcDNA3.1除了有克隆載體相關元件,如復制起始位點Ori,原核篩選標記Amp外,還有一些其他的功能元件,如表3所示。
表達載體主要用於表達蛋白或者RNA,例如現在基因編輯中常用的一個表達載體PX458(圖12),可以同時表達Cas9蛋白和sgRNA。因此上面也會攜帶一些其他的功能元件(表4)。
上面介紹的pcDNA3.1和PX458均是瞬時表達載體並不能在人類等細胞中進行復制,隨著細胞的分裂,單個細胞中的質粒不斷的被稀釋,因此這些載體只能起到瞬時表達的效果。而慢病毒表達載體則可以介導表達元件整合到人類細胞的基因組中,這些表達元件可以隨著基因組DNA的復制而復制,因此可以實現穩定表達。
我們常用的慢病毒載體是以HIV-1(人類免疫缺陷I型病毒)為基礎發展起來的基因治療載體,攜帶有外源基因的慢病毒載體在慢病毒包裝質粒、細胞系的輔助下,經過病毒包裝成為有感染力的病毒顆粒,將其進行收集和濃縮後可直接感染宿主細胞或者動物模型,將外源基因有效地整合到宿主的染色體上,從而達到外源基因的持久性表達。我們以pGreenPuro為例說明慢病毒表達載體中一些關鍵的功能元件(圖13,表5)。
(6)感受態細胞
感受態細胞是採用理化方法誘導過的細胞,它可以吸收周圍環境中的DNA分子。實驗室中我們常使用 E. coli 進行感受態細胞的制備,主要包括克隆用的感受態細胞和表達用的感受態細胞(圖14)。
如果僅僅是進行質粒擴增,我們一般使用克隆感受態細胞。如果要進行原核蛋白質表達,我們則選擇表達感受態細胞。並且感受態細胞的基因型也有很多類,是通過不同基因的缺失形成的,因而使細胞具有不同的特性,以滿足不同的需要。例如,進行克隆載體和瞬轉表達載體的擴增,常選用 E. coli DH5α,TOP10菌株;而慢病毒載體則一般選擇低重組率的 E. coli Stbl3菌株。而對於非甲基化載體的擴增,則需要選擇 E. c oli dam-/dcm- 等甲基化酶缺失的菌株。
2. 基因克隆流程
前面了解了基因克隆使用的相關工具酶和載體,接下來,我們介紹基因克隆的實驗流程。細分的話,包括以下10個步驟(表6)。
下面我們以lncRNA PVT1的克隆和表達,分別採用T/A克隆,傳統酶切-酶連克隆和無縫克隆進行示例。
(1) T/A克隆
T/A克隆是把PCR片段與一個具有3』-T突出的載體DNA連接起來的方法(圖15)。使用該方法進行基因克隆時不需要考慮酶切位點問題,但需要選擇Taq DNA聚合酶進行PCR擴增,其產物的3』端才會多一個突出的A;此外,T/A克隆選用商業化的T載體,其為線性化的載體,在3』端有一個突出的T;並且基因片段連入T載體是沒有方向性的,正反都有可能。
我們首先從NCBI上獲取PVT1(human)的基因序列信息( https ://www.ncbi.nlm.nih.gov/nuccore/MG562504.1 ),然後使用SnapGene等進行PCR引物設計(圖16)。以PVT1全長序列(1081nt)為模板,設計的引物正向引物的5』端與PVT1序列的5』端相同,反向引物的5』端與PVT1序列的3』端互補。然後使用Taq DNA 聚合酶,以細胞的cDNA為模板進行PCR,產物經瓊脂糖凝膠電泳或割膠回收目的大小片段(圖17)。
膠回收的基因片段與商業化的T載體(pMD-18T)連接,形成重組DNA載體pMD18-PVT1(圖18),經轉化(圖19)和菌落PCR(圖20)後篩選到候選陽性克隆,再使用Sanger測序(圖21)進行插入序列的鑒定,獲得陽性克隆。
(2) 傳統酶切 - 酶連克隆
傳統酶切-酶連克隆主要是採用相同的限制性內切酶(或者同尾酶)分別酶切載體和基因片段,然後使用DNA連接酶進行連接,轉化。以下,我們同樣以PVT1為例,將其使用傳統方法克隆至pcDNA3.1表達載體上。
我們在獲得PVT1的基因全長序列後,需要首先進行酶切位點分析,例如使用SnapGene進行常用6鹼基識別位點的限制性內切酶位點分析(圖22)。同時,我們分析pcDNA3.1中MCS中可用的酶切位點,我們排除PVT1有的限制性內切酶並排除同尾酶(避免載體的自連),即可得到可用的限制性內切酶。在這里我們選擇 Nhe I和 Eco R I(圖23)。
接下來,我們以PVT1的全長序列為模板設計克隆引物(SnapGene設計的引物序列與T/A克隆中一樣),不過我們還要在引物的5』端添加選擇好的限制性內切酶的酶切位點以及相應的保護鹼基(圖24)。同樣使用Taq DNA 聚合酶或者其他高保真DNA聚合酶,以細胞的cDNA為模板進行PCR,產物經瓊脂糖凝膠電泳或割膠回收目的大小片段。
回收的PVT1 PCR產物和pcDNA3.1載體均使用 Nhe I和 Eco R I進行雙酶切,其中PVT1由於酶切後的序列為一個約1000bp的片段和一個約5bp的片段,無需進行割膠回收,直接使用PCR產物純化柱進行酶切產物純化即可(圖25)。而pcDNA3.1的酶切由於可能存在未完全切開的質粒(在後續轉化中會形成大量的假陽性克隆),需要進行瓊脂糖凝膠電泳,割取線性化的載體片段進行膠回收(圖25)。然後將PVT1和pcDNA3.1酶切片段使用DNA連接酶進行連接,轉化。同樣,使用菌落PCR和Sanger測序進行陽性克隆子pcDNA3.1-PVT1的篩選(圖26)。
(3) 無縫克隆
無縫克隆的一個重要優勢是不需要考慮待克隆片段中的酶切位點情況,因此直接選擇相應的酶切位點將載體線性化後,根據載體的線性化末端進行同源引物的設計,PCR擴增目的基因並純化後直接進行重組連接和轉化(圖27)。以下,我們同樣以PVT1克隆至pcDNA3.1載體為例進行說明。
獲得PVT1和pcDNA3.1的全長序列後可以使用SnapGene,CE Design(Vazyme)和In-Fusion Clone(Takara)等在線或本地軟體進行同源臂引物的設計。
使用同源臂引物,以細胞cDNA為模板,使用高保真DNA聚合酶為模板進行PCR,膠回收相應片段。pcDNA3.1載體使用 Nhe I和 EcoR I進行雙酶切後,割膠回收載體片段。然後添加無縫克隆試劑進行重組連接,轉化後進行陽性克隆的篩選與鑒定。
而實際上,無縫克隆還有另外一個重要的優勢:可以同時進行多片段的重組克隆,而這對於傳統酶切-酶連克隆是一個很大的挑戰。基於傳統克隆技術可能需要克隆一個片段後,再在特定位置選擇酶切位點,插入第二個片段,依次推進,這樣不僅實驗周期長,並且會在每個片段之間引入了額外的酶切位點鹼基序列,可能影響到基因的完整性。不過可以通過融合PCR的方式,設計末端重疊的引物進行各個克隆片段的融合,但長的基因片段的PCR擴增本身也存在著失敗率提高的問題(表8)。
總結
本部分我們主要介紹了基因克隆中使用的工具酶和載體,並以PVT1的克隆和表達載體的構建為例,分別介紹了T/A克隆、傳統酶切-酶連克隆和無縫克隆技術的實驗流程。
參考文獻
1. Vasu,K. and V. Nagaraja, Diverse functions of restriction-modification systems in addition to cellular defense.MicrobiolMol Biol Rev, 2013. 77 (1): p. 53-72.
2. Loenen, W.A., et al., Highlights of the DNA cutters: a short history of the restriction enzymes.Nucleic Acids Res, 2014. 42 (1): p. 3-19.
3. Pingoud, A., G.G. Wilson, and W.Wende, Type II restriction endonucleases--a historical perspective and more.Nucleic Acids Res, 2014. 42 (12): p. 7489-527.
4. Gibson, D.G., et al., Enzymatic assembly of DNA molecules up to several hundred kilobases.Nat Methods, 2009. 6 (5): p. 343-5.
5. Xia, Y., et al., T5 exonuclease-dependent assembly offers a low-cost method for efficient cloning and site-directed mutagenesis.Nucleic Acids Res, 2019. 47 (3): p.e15.