浙江大學生命科學學院 徐冰
浙江杭州 310029
1 國內外研究現狀
擬南芥(Arabidopsis thaliana)是一種模式植物,具有基因組小(125 Mbp)、生長周期短等特點,而且基因組測序已經完成(The Arabidopsis Genomic Initiative, 2000)。同時,擬南芥屬十字花科(Cruciferae),具有高等植物的一般特點,擬南芥研究中所取得成果很容易用于其它高等植物包括農作物的研究,產生重大的經濟效益,特別是十字花科中還有許多重要的經濟作物,與人類的生產生活密切相關,因此目前擬南芥的研究越來越多地受到國際植物學及各國政府的重視。
從遺傳學的觀點來看,基因克隆的途徑可概括為正向遺傳學和反向遺傳學兩種。正向遺傳學途徑指的是通過被克隆基因的產物或表現型突變去進行;反向遺傳學途徑則指的是依據被克隆基因在染色體上的位置來實現。雖然一些模式生物(如擬南芥)的基因組測序已經完成,但還有40%的基因(在擬南芥中)的功能還是未知的。
圖1 圖位克隆所需努力的比較(1995年和2002年)(Jander等, 2002)
圖位克隆(map-based cloning)又稱定位克隆(positional cloning),1986年首先由劍橋大學的Alan Coulson提出(Coulson等,1986),用該方法分離基因是根據目的基因在染色體上的位置進行的,無需預先知道基因的DNA序列,也無需預先知道其表達產物的有關信息。它是通過分析突變位點與已知分子標記的連鎖關系來確定突變表型的遺傳基礎。近幾年來隨著擬南芥基因組測序工作的完成,各種分子標記的日趨豐富和各種數據庫的完善,在擬南芥中克隆一個基因所需要的努力已經大大減少了(圖1)。
目前完成整個擬南芥的圖位克隆過程大約需要一年時間。在這個過程中,我們從篩選突變體開始,逐漸找到和表型相關的基因。這和反向遺傳學的方法正好相反。圖位克隆能實現,關鍵在于全基因組測序計劃的完成和各種分子標記的發現。這些數據被儲存在專門的數據庫中(表1)(Lukowitz等, 2000)。在擬南芥中的圖位克隆,在很大程度上得益于對Col-0生態型測序的完成,因為它是在研究擬南芥時最常用的生態型。
實現基因圖位克隆的關鍵是篩選與目標基因連鎖的分子標記。實質上,分子標記是一個特異的DNA片段或能夠檢出的等位基因,對其有效地利用即可達到圖位克隆基因之目的。迄今為止,已有幾十種技術可用于分子標記的篩選(Wang等,2000)。其中最為常用的是簡單序列長度多態性(SSLPs)(Lukowitz等, 2000; Choe等, 2002; Gonzalez-Guzman等, 2002)。和單核苷酸多態性(SNPs)(Rafalski, 2002)。SSLP是基于PCR的分子標記,在擬南芥基因組中有較多分布,而且是共顯性的,它的檢測非常直接,但是我們需要設計引物來檢測假定的SSLP標記;對SNPs標記的檢測也比較直接,它是擬南芥不同生態型之間基因組中的單個核苷酸的差別,這些差別的核苷酸通常位于不編碼區域(Peters等, 2003)。最常見的用于檢測SNPs標記的方法主要是剪切擴增多態性序列(CAPS),它也是基于PCR的。另外,一種更為有效的方法衍生的CAPS(dCAPS)(Nam等, 1989; Michaels 和 Amasino, 1998)可把任何已知的點突變作為分子標記,只要在PCR是引入不配對的引物,使擴增的序列在一個生態型中具有限制性酶切位點,而在另一生態型中沒有,以形成多態性。
圖位克隆法隨著相關配套技術(序列數據庫、分子標記等)的日漸成熟,許多擬南芥及一些農作物的基因已被成功的克隆(表2)。本文擬對圖位克隆的研究進展做一介紹,以期對植物遺傳育種和分子生物學研究有所幫助
表1 擬南芥網絡資源
網站
|
網址
|
Supplemental material for this paper
|
http://carnegiedpb.stanford.edu/methods/ppsuppl.html
|
Nottingham Stock Centre(U.K.)
|
http://nasc.nott.ac.uk/
|
Recombinant Inbred map
|
http://nasc.nott.ac.uk/new_ri_map.html
|
Ohio Stock Center(U.S.A.)
|
http://aims.cps.msu.edu/aims/
|
TAIR database*, homepage
|
http://www.arabidopsis.org
|
Recombinant Inbred map(mirror site)
|
http://www.arabidopsis.org/cgi-bin/maps/Riintromap
|
CAPS markers
|
http://www.arabidopsis.org/aboutcaps.html
|
Sequence table
|
http://www.arabidopsis.org/cgi-bin/maps/Seqtable.pl
|
SNP collection
|
http://www.arabidopsis.org/SNPs.html
|
CEREON collection of polymorphisms
|
http://www.arabidopsis.org/cereon
|
SSLP markers
|
http://genome.bio.upenn.edu/SSLP_info/SSLP.html
|
TIGR, genome annotations
|
http://www.tigr.org/tdb/athl/htmls/index.html
|
Database of Ler sequences
|
http://www.tigr.org/tdb/atgenome/Ler.html
|
Kasuza DNA Research Institute, genome annotations
|
http://www.kazusa.or.jp/kaos/
|
MIPS genome annotations
|
http://websvr.mips.biochem.mpg.de/proj/thal/
|
SINS database of transposon insertions
|
http://www.jic.bbsrc.ac.uk/sainsbury-lab/jonathan-jones/jjhome.htm
|
*注:The Arabidopsis Information Resource (TAIR)
|
2 圖位克隆的一般過程
因為有了擬南芥的基因組序列和高密度的遺傳標記,圖位克隆過程就變得相對直接。圖2例舉了一種高效的擬南芥圖位克隆方法。從基于Col-0和Ler遺傳背景的突變體出發,我們有可能在大約一年時間內找出與這個突變相關的基因,這其中主要耗時間的是五個植物(擬南芥)的生長周期(我們假定每個周期為兩個月)。
作為作圖過程的第一步,突變體植株將和另外一個生態型(Col-0或者Ler)的植株雜交。在大多數情況下,用于雜交的突變體植株是作為父本還是母本是沒有關系的。然后播種F1代種子。在F1代植物的生長過程中,我們就有可能來對其表現型和基因型進行分析。F1代植物的表型的出現或者消失將顯示著我們所研究的突變是顯性的還是隱性的。最好通過對一些標記的分析來確認F1代植物是雜合體,而且在雜交過程中我們沒有犯錯誤。當然也有必要確認原來的生態型背景。
表2 用圖位克隆方法得到的擬南芥及一些農作物的基因
基因
|
突變表型
|
基因同源序列
|
AB13 |
脫落酸不敏感
|
玉米轉錄子
|
FID3
|
降低亞油酸飽和度
|
細菌去飽和酸酶
|
AXR1
|
生長素抗性
|
泛素N 端活性酶
|
ETR1
|
乙烯抗性
|
雙因子調節子
|
ABI1
|
脫落酸不敏感
|
鈣調蛋白磷酸化酶
|
DET1
|
黃化損傷反應
|
新核蛋白
|
RPS2
|
抗病
|
新型富含亮氨酸的蛋白酶
|
RPM1
|
抗病
|
激酶
|
RSW1
|
纖維素合成酶
|
細胞色素P450 家系
|
ZLL
|
調節中莖分生
|
細胞胚胎發育蛋白
|
PRT1
|
抑制胞間蛋白降解
|
控制植物N 端代謝
|
Tornadol
|
植株短化
|
——
|
IFL1
|
正常的維管束間纖維分化受阻
|
亮氨酸拉鏈蛋白
|
ARA1
|
樹膠醛糖激酶活性喪失
|
半乳糖激酶基因家族
|
VTC2
|
維生素C合成不足
|
果蠅蛋白CG3552,線蟲蛋白C10F3.4(功能未知)
|
AST
|
種皮花青苷斑點
|
花青苷生物合成途徑中的二氫黃酮醇-4-還原酶
|
圖2 圖位克隆過程示意圖(Jander等, 2002)
F1代植物自交得到F2代種子,大約播種600個個體以進行突變基因的粗定位(first-pass mapping,圖2)。在其生長過程中,我們可確定其表型,大約有150個個體被認為是純合體(在隱性突變的情況下是純合突變體,在顯性突變的情況下是純合野生型)。然后從這150個個體的葉子或者其它組織中制備DNA用于基因型分析。起先用分布于擬南芥五條染色體上的25個標記(相鄰的兩個標記之間大約相距20 cM)進行分析,確定突變基因是和哪個或者哪幾個標記是連鎖的,然后用三點測交的方法來定義一個包含突變基因的大約20 cM的遺傳間隔。一旦這樣的一個遺傳間隔被定義之后,接下來的工作就是引入新的標記把這個間隔縮小到大約4 cM。一般來說,利用150個F2代個體是在很大程度上能找到這樣一個遺傳間隔的,距離突變基因最近的兩個分子標記將作為側面標記而用于下面的進一步分析。
下一步我們將播種一個更大的F2代群體用于突變基因的精細定位(fine-resolution mapping,圖2)。最終目標是將包含突變基因的遺傳間隔縮小到40 Kb甚至更小(這在擬南芥中大約是0.16 cM)。顯然用于作圖的F2代植物越多,就越能精確地定位突變基因。一般需要3000~4000個F2代植物個體(包括粗定位時的600個F2代植物個體)來精確地定位突變基因。但是也有很多圖位克隆過程用了少于3000個F2代植物個體就成功地定位了突變基因(Lukowitz等, 2000)。但是這往往要冒因為作圖群體不夠大再一次種植F2代植物而延長整個作圖過程的時間的風險。
在這個大約4 cM的遺傳間隔內找到與突變更緊密連鎖的分子標記,一般情況下能在突變兩側找到相距小于40 Kb的兩個分子標記。一旦這樣的兩個分子標記被找到之后,就可以通過測序來找到突變基因。一種有效的方法是設計PCR引物來擴增覆蓋這40 Kb的多個重疊的500 bp的片段。將這些片段測序后拼接起來以得到整個40 Kb的序列,然后將它與野生型植物(Col-0或者Ler)的序列進行比對,這就可以找到這個區域中的多個基因。從一系列侯選基因中鑒定基因是定位克隆技術的最后一個關鍵環節。現在最常用的方法是用含有目標基因的大片段克隆如BAC克隆或YAC克隆去篩選cDNA文庫,并查詢生物數據信息庫,待找出侯選基因后,把這些侯選基因進行下列分析以確定目標基因:(1)精確定位法檢查cDNA是否與目標基因共分離;(2)檢查cDNA時空表達特點是否與表型一致;(3)測定cDNA序列,查詢數據庫,以了解該基因的功能;(4)篩選突變體文庫,找出DNA序列上的變化及與功能的關系;(5)進行功能互補實驗,通過轉化突變體觀察突變體表型是否恢復正常或發生預期的表型變化。功能互補實驗是最直接、最終鑒定基因的方法。利用新興的RNA干擾(RNAi)也可有效地確定目的基因。
3 存在的問題
圖位克隆也有其自身的局限性,在某些情況下,就很難或者不能通過圖位克隆技術來定位基因。
在分析自然發生的變異的時候,我們最有可能遇到的復雜情況是一個給定的性狀是由不止一個的基因位點控制的。例如,在Kashmir-1(有抗性的)和Columbia(敏感的)株系之間的雜交實驗中,我們發現粉狀霉菌抗性基因至少涉及三個遺傳位點,它們是以附加的方式起作用的(I.Wilson, C. Schiff, 和 S. Somerville,個人交流)。對這些抗性基因中的任何一個作精細定位都要求降低作圖群體的遺傳復雜性,例如通過創造只有一個位點保持多態性的重組近交系。在擬南芥的株系之間雜交時,很多種性狀是由一個或多個遺傳位點控制的,其中包括開花時間,種子大小,冬眠,生理節律,次生代謝以及表皮毛的密度(綜述見Alonso-Blanco 和 Koornneef,2000)。無論何時,當影響這些性狀的自然或者誘導的突變被定位的時候,第二位點修飾成分會干擾這些分析。
表觀(上位)遺傳突變這個術語是描述一個基因在表達和功能上的可遺傳改變,而不涉及DNA序列的改變(綜述見Wolffe 和 Matzke,1999),這是圖位克隆工程中又一個可能的復雜情況。已有文獻很好地證明的是花發育基因SUPERMAN的后生clark kant等位基因(Jacobson 和 Meyerowitz,1997)。這些等位基因是可遺傳的,但它們不穩定有一個小的回復率。它們在SUPERMAN基因的DNA序列中都具有相似的胞嘧啶甲基化現象,結果,有可能減少了SUPERMAN基因轉錄子的表達。它們中沒有一個是和SUPERMAN的DNA序列改變聯系在一起的;盡管如此,它們能被帶有SUPERMAN基因的轉基因所補充。目前,對于這種表觀遺傳突變是怎么產生的以及它們出現的頻率知道的不多。
關于染色體上位點的物理和遺傳距離的比值是變化的。通常這種變化是比較小的,對作圖的分辨率也只有較小的影響(Copenhaver等,1998)。但是,有證據表明有些染色體區域是例外的。例如,對GURKE基因的圖位克隆就非常困難,這個基因的定位接近于第一條染色體的著絲粒;在著絲粒附近重組是嚴格限制的,使得對它精細定位的努力非常無效。而且,在這個區域中重復DNA單元的廣泛分布使我們辨認出散布的單拷貝序列,這些單拷貝序列能產生有疑問的遺傳標記(R. Torres Ruiz,個人交流)。這個發現是經過對第二條染色體上的物理和遺傳距離之間的比值的系統地分析之后確認的(Lin等,1999)。對這條染色體的幾乎全序列,1%重組的遺傳距離相當于100~400 Kb的物理距離,平均是250 Kb。然而著絲粒區域是一個顯著的例外,在這里1%重組的遺傳距離相當于1000~2500 Kb。看來值得指出的是在現存的物理圖譜中,擬南芥的五個著絲粒是沒有一個被完全覆蓋的。最近對著絲粒區域的分析顯示這些區域通常包含重復的DNA和幾乎不含表達的基因(Copenhaver等,1999)。因此,由于接近著絲粒,應該沒有擬南芥基因是不服從圖位克隆策略的。
除了著絲粒,第二條染色體上也有一個小片段上1%重組的遺傳距離相當于1000 Kb甚至更多。根據推測,觀察到的低重組率現象可能是由于被用于作圖分析的株系的DNA序列的重排(Lin等,1999;Mayer等,1999)。第二和第四條染色體的DNA序列的比較顯示有些基因片段是在這兩條染色體之間被復制的(其中一個片段的大小是4.6 Mb),還有一個從線粒體基因組向第二條染色體轉移的DNA片段(Lin等,1999)。這些發現清楚地證明了擬南芥基因組的結構是可以不斷改變的。因此,不同株系之間的遺傳變異可能不僅僅是由點突變和DNA重排導致的,這就從根本上給圖位克隆工程造成了嚴重的問題。舉例來說,如果在兩個株系之間發生倒轉的一個大約500 Kb的序列被用于形成的一個作圖群體,所有發生在這個倒轉內的重組事件將產生不育的減數分裂產物。因此,不可能在這個倒轉序列內對突變進行作圖。到目前為止,發生在常見株系之間的這樣的DNA重排還沒有被報道過,確實應該是這樣,因為它們很難被檢測到。在一個作圖實驗中,它們的出現將很有可能被忽視直到最后一步。
有時候,T-DNA插入和輻射也被觀察到能導致DNA的重排(Shirley等,1992;Nacry等,1998;Laufs等,1999;Ogas等,1999)。因此,當被作圖的突變是由這些方法產生的時候,類似的困難也有可能產生。但在這些情況下,至少有一定的可能性突變是和重排的一個或兩個斷裂點有關。
4 前景展望
目前,在擬南芥中的圖位克隆已經不僅僅是一些專注的(和持久的)專家的工作了,而是每個人都能完成的工作。在過去的幾年中,產生了很多便宜但功能強大的工具,同時也有大量的信息被收集在免費的數據庫中。利用這些資源,目前大部分的圖位克隆工程應該是可以肯定的,直接的,也是簡單的。隨著我們對擬南芥基因組結構和變化的認識的增長,情況將進一步改善,因為這將有助于我們消除部分上面提到的仍然存在的復雜情況,或者至少使得它們可被控制。
參考文獻
1. Choe,S., Schmitz,R.J., Fujioka,S., Takatsuto,S., Lee,M.O., Yoshida,S., Feldmann,K.A., and Tax,F.E. (2002). Arabidopsis brassinosteroid-insensitive dwarf12 mutants are semidominant and defective in a glycogen synthase kinase 3 beta-like kinase. Plant Physiology 130, 1506-1515.
2. Gonzalez-Guzman,M., Apostolova,N., Belles,J.M., Barrero,J.M., Piqueras,P., Ponce,M.R., Micol,J.L., Serrano,R., and Rodriguez,P.L. (2002). The short-chain alcohol dehydrogenase ABA2 catalyzes the conversion of xanthoxin to abscisic aldehyde. Plant Cell 14, 1833-1846.
3. Jander,G., Norris,S.R., Rounsley,S.D., Bush,D.F., Levin,I.M., and Last,R.L. (2002b). Arabidopsis map-based cloning in the post-genome era. Plant Physiology 129, 440-450.
4. Lukowitz,W., Gillmor,C.S., and Scheible,W.R. (2000c). Positional cloning in arabidopsis. Why it feels good to have a genome initiative working for you. Plant Physiology 123, 795-805.
5. Michaels,S.D. and Amasino,R.M. (1998). A robust method for detecting single-nucleotide changes as polymorphic markers by PCR. Plant J. 14, 381-385.
6. Nam,H.G., Giraudat,J., Den Boer,B., Moonan,F., Loos,W., Hauge,B.M., and Goodman,H.M. (1989). Restriction Fragment Length Polymorphism Linkage Map of Arabidopsis thaliana. Plant Cell 1, 699-705.
7. Peters,J.L., Cnudde,F., and Gerats,T. (2003). Forward genetics and map-based cloning approaches. Trends in Plant Science 8, 484-491.
8. Rafalski,A. (2002). Applications of single nucleotide polymorphisms in crop genetics. Curr. Opin. Plant Biol. 5, 94-100.