DNA,RNA和蛋白質是三種重要的生物大分子,是生命現象的分子基礎。基因組DNA中的基因通過轉錄為mRNA并進一步翻譯為蛋白質,很多種類的蛋白質在最終發揮功能時又經歷磷酸化、糖基化、酶原激活等翻譯后修飾。DNA的遺傳信息決定生命的主要性狀,而mRNA在信息傳遞中起很重要的作用。其它兩大類RNA,rRNA和tRNA,同樣在蛋白質的生物合成中發揮不可替代的重要功能。因此mRNA、rRNA、tRNA在遺傳信息由DNA傳遞到表現生命性狀的蛋白質的過程中舉足輕重。目前國內外在mRNA的表達研究上如火如荼,這對于后基因組時代闡明基因的功能至關重要。
但RNA在生命活動中的重要作用遠不止如此:很多種類的病毒直接以RNA為遺傳信息攜帶者,如SARS和AIDS等;而很多其它種類的不編碼蛋白質的RNA分子在生命活動中起其它重要作用,如大分子生物加工和基因表達調控等。下面簡要列舉一些重要的RNA分子及其生物學意義:
snRNA參與 mRNA剪接、 snoRNA參與rRNA成熟加工、 gRNA參與RNA編輯、SRP-RNA參與蛋白質的分泌、端粒 RNA參與 DNA端粒合成并影響細胞的壽命、tmRNA參與破損mRNA蛋白質合成的終止等。
gRNA(導引RNA):mRNA編輯
snRNA(核內小分子RNA):mRNA加工(剪接和成熟)
snoRNA(核仁小分子RNA):rRNA加工(切割和修飾)
RNA P(RNA聚合酶):tRNA加工
Telomerase RNA:DNA復制
SRP(信號識別顆粒)-RNA:轉運
Lin-4:發育控制反義RNA(antisence RNA for development control)
rps14:核糖體生物合成反義RNA(antisence RNA for ribosome biogenesis)
dsRNA(雙鏈RNA):基因沉默(gene silence)
Xist (Xi-specific transcript)&其反義RNA Tsix:X染色體失活
尚有很多RNA的功能還未鑒定,如很多scRNA(細胞質小分子RNA)、用沉降系數命名的7S,10SRNA等。一些生物催化劑如核酶和轉肽酶也是RNA。
國內中山大學和上海生命科學院等在這些非編碼RNA的研究中做了大量工作,在國際上也占有一席之地。
RNA的種類可能還遠不止這些,每種RNA的功能也遠不止上面提到的那么簡單。隨著研究的深入,更多種類的RNA和RNA的功能在被詮釋。因此生命科學中的一個新的學科RNA組學(RNomics)正在興起。
勿容質疑的現實是:在所有種類RNA功能等的研究中,mRNA的表達研究是最主要的熱點。特定生物的基因在不同發育階段、不同生理病理條件、不同細胞類型中的表達不盡相同,了解基因表達的開放與否和表達水平高低對闡明基因的功能至關重要。mRNA表達研究的傳統技術如Northern、原位雜交和定量RT-PCR等低通量技術適于少量基因的表達研究。但我們知道:參與任何一個生命過程的基因種類都有很多,因此低通量技術已經不適合大量基因表達的研究,高通量研究基因表達的技術應運而生,在這些技術中,DD-PCR和SSH技術操作復雜,假陽性率很高;因此近二十年來發展起來的DNA微陣列技術尤其是全基因組DNA微陣列技術目前成為獲得基因表達信息的最好技術平臺,該技術可以在盡可能短的時間內篩選出參與一個生命過程的所有的基因的表達數據。
DNA微陣列技術主要有兩種:cDNA微陣列和寡核苷酸微陣列。在cDNA 微陣列中,每個基因的探針為cDNA或基因的一段PCR產物;這種探針設計策略很難特異區分諸如RNA剪接體、重疊基因和G蛋白偶聯受體等同源基因。寡核苷酸微陣列技術又包括兩種:約70mer的寡核苷酸微陣列和Affymetrix 25mer寡核苷酸基因芯片(Genechip)。在70mer微陣列中,每個基因的探針為該基因的一段70mer的特異寡核苷酸片段。在Affymetrix基因芯片中,每個基因都有10-20個特異探針(PM探針),每個探針為25mer的寡核苷酸片段;每個探針還有對應的錯配(MM)探針。探針特異性由大到小的排序為:25mer>70mer>cDNA。因此,Affymetrix基因芯片技術可以保證基因表達檢測的最好特異性。由于MM探針可以有效扣除總雜交信號中的背景信號,得到真正的雜交信號,因此Affymetrix基因芯片技術還可以保證基因芯片檢測的高靈敏度,這里的高靈敏度指可以檢測到低豐度表達的基因,也同時指低豐度表達的基因的表達水平發生變化時可以被檢測出來。目前看來,Affymetrix基因芯片技術可以保證基因表達檢測的最好特異性、最高靈敏度、最好的重復性和可靠性及最好的定量分析。因此Affymetrix基因芯片技術得到的基因表達信息基本沒有必要通過定量RT-PCR、原位雜交和Northern等技術來驗證。
當然,Affymetrix基因芯片技術的局限性在于該技術依賴基因組序列信息。如果一個物種的基因組序列信息已知,Affymetrix就可以通過生物信息學等設計代表每一個基因的特異的探針。盡管Affymetrix芯片涉及的物種已經居全球首位(Affymetrix公司目前能提供的芯片物種信息見本刊后面的專題介紹),由于很多生物沒有基因組序列信息,高通量研究這些生物的基因表達信息還只能依賴構建cDNA文庫并制作cDNA微陣列,這樣得到的基因表達信息需要通過定量RT-PCR、原位雜交和Northern等技術來驗證。
基因芯片得到的基因表達數據很豐富,通過生物信息學可以得到其中最具有價值的信息,比如哪些基因可能與研究者研究的生理或病理現象直接相關。對于這些重要基因的功能的研究,下一步的技術包括RNAi(本刊中有多篇專題介紹),基因敲除和轉基因技術等。而基因功能的最終闡明需要結合蛋白質(組)的研究等。
最后需要指出的是,不同細胞類型在不同生理或病理條件下或在不同的發育階段,其基因表達情況不盡相同,如果采取勻漿技術獲得含多種類型細胞的組織中的mRNA并雜交基因芯片,那么得到的數據無法精確解釋每一類細胞的基因表達情況。建立細胞類型特異性的基因表達數據對研究生命現象的分子機理很重要,可以通過激光顯微切割(laser microdissection, LMD,詳見本刊專題介紹)技術將一個組織中不同類型的細胞進行分離,從不同細胞類型中分別得到各自的mRNA,然后分別雜交基因芯片。當然,LMD技術對建立細胞特異性的蛋白質表達數據信息也至關重要。