生物科學正迅速地演變為一門信息科學。最明顯的一個例子就是目前正在進行的HGP(human genome project),最終要搞清人類全部基因組的30億左右堿基對的序列。除了人的遺傳信息以外,還有其它生物尤其是模式生物(model organism)已經或正在被大規模測序,如大腸桿菌、啤酒酵母、秀麗隱桿線蟲以及中國和日本科學家攻關的水稻基因組計劃。但單純知曉生物基因組序列一級結構還遠遠不夠,還必須了解其中基因是怎樣組織起來的,每個基因的功能是什么,又是怎樣隨發育調控和微環境因素的影響而在特定的時空域中展開其表達譜的,即我們正由結構基因組時代邁入功能基因組時代。隨著這個功能基因組學問題的提出(后基因組時代,蛋白組學)[1],涌現出許多功能強大的研究方法和研究工具,最突出的就是細胞蛋白質二維凝膠電泳(2-D-gel)(及相應的質譜法測蛋白分子量)和生物芯片(Biochip)技術[2]。
一. 什么是基因芯片
生物芯片,簡單地說就是在一塊指甲大小(1cm3)的有多聚賴氨酸包被的硅片上或其它固相支持物(如玻璃片、硅片、聚丙烯膜、硝酸纖維素膜、尼龍膜等,但需經特殊處理。作原位合成的支持物在聚合反應前要先使其表面衍生出羥基或氨基(視所要固定的分子為核酸或寡肽而定)并與保護基建立共價連接;作點樣用的支持物為使其表面帶上正電荷以吸附帶負電荷的探針分子,通常需包被以氨基硅烷或多聚賴氨酸等)將生物分子探針(寡核苷酸片段或基因片段)以大規模陣列的形式排布,形成可與目的分子(如基因)相互作用,交行反應的固相表面,在激光的順序激發下標記熒光根據實際反應情況分別呈現不同的熒光發射譜征,CCD相機或激光共聚焦顯微鏡根據其波長及波幅特征收集信號,作出比較和檢測,從而迅速得出所要的信息。生物芯片包括基因芯片、蛋白質芯片、組織芯片。而基因芯片中,最成功的是DNA芯片,即將無數預先設計好的寡核苷酸或cDNA在芯片上做成點陣,與樣品中同源核酸分子雜交[3]的芯片。
基因芯片的基本原理同芯片技術中雜交測序(sequencing by hybridization, SBH)。即任何線狀的單鏈DNA或RNA序列均可被分解為一個序列固定、錯落而重疊的寡核苷酸,又稱亞序列(subsequence)。例如可把寡核苷酸序列TTAGCTCATATG分解成5個8 nt亞序列:
(1) CTCATATG
(2) GCTCATAT
(3) AGCTCATA
(4) TAGCTCAT
(5) TTAGCTCA
這5個亞序列依次錯開一個堿基而重疊7個堿基。亞序列中A、T、C、G 4個堿基自由組合而形成的所有可能的序列共有65536種。假如只考慮完全互補的雜交,那么48個8 nt亞序列探針中,僅有上述5個能同靶DNA雜交。可以用人工合成的已知序列的所有可能的n體寡核苷酸探針與一個未知的熒光標記DNA/RNA序列雜交,通過對雜交熒光信號檢測,檢出所有能與靶DNA雜交的寡核苷酸,從而推出靶DNA中的所有8 nt亞序列,最后由計算機對大量熒光信號的譜型(pattern)數據進行分析,重構靶DNA 的互補寡核苷酸序列。
二.芯片類型
一般基因芯片按其材質和功能,基本可分為以下幾類[4]
(一)元件型微陣列芯片
1生物電子芯片
2凝膠元件微陣列芯片
3藥物控釋芯片
(二) 通道型微陣列芯片
1毛細管電泳芯片
2 PCR擴增芯片
3集成DNA分析芯片
4毛細管電層析芯片
(三)生物傳感芯片
1光學纖維陣列芯片
2白光干涉譜傳感芯片
小鼠基因表達譜芯片(MGEC)
附:目前國內基因芯片常見品種.(上海博星公司)
芯片品種 |
芯片點數 |
MGEC-20S |
2000 |
MGEC-40S |
4000 |
MGEC-80S |
8000 |
癌癥相關基因表達譜芯片(CRGEC)
分類 |
芯片型號 |
芯片點數 |
肝癌相關基因表達譜芯片 |
LiverC-16S |
1626 |
LiverC-16D |
3252 |
|
LiverC-9.5NS |
954 |
|
LiverC-9.5ND |
1908 |
|
肺癌相關基因表達譜芯片 |
LungC-7.3S |
737 |
LungC-7.3D |
1474 |
人類基因表達譜芯片(HGEC)
芯片品種 |
芯片點數 |
HGEC-10S |
1024 |
HGEC-10D |
2048 |
HGEC-20S |
2048 |
HGEC-20D |
4096 |
HGEC-40S |
4096 |
HGEC-40D |
8192 |
HGEC-80S |
8192 |
HGEC-80D |
16184 |
<![endif]>
三 基因芯片的制備
芯片種類較多,制備方法也不盡相同,常見的芯片可分為兩大類:一類是原位合成;一種是直接點樣。原位合成適用于寡核苷酸;直接點樣多用于大片段DNA,有時也用于寡核苷酸,甚至mRNA。原位合成有兩種途徑。一是光蝕刻法;一是噴印法。光蝕刻法可以合成30nt左右,噴印法可以合成40-50nt,光蝕刻法每步縮合率較低,一般為95%左右,合成30nt產率僅20%;噴印法可達99%以上,合成30nt產率可達74%,從這個意義上說噴印法特異性應比光刻法高。此外,噴印法不需特殊的合成試劑。與原位合成法比較點樣法較簡單,只需將預先制備好的寡核苷酸或cDNA等樣品通過自動點樣裝置點于經特殊處理的玻璃片或其它材料上即可。
1 原位光蝕刻合成[5-7] 寡聚核苷酸原位光蝕刻合成技術是由Affymetrix公司開發的,采用的技術原理是在合成堿基單體的5'羥基末端連上一個光敏保護基。合成的第一步是利用光照射使羥基端脫保護,然后一個5'端保護的核苷酸單體連接上去,這個過程反復進行直至合成完畢。使用多種掩蓋物能以更少的合成步驟生產出高密度的陣列,在合成循環中探針數目呈指數增長。某一含n個核苷酸的寡聚核苷酸,通過4×n個化學步驟能合成出4n個可能結構。例如:一個完整的十核苷酸通過32個化學步驟,8個小時可能合成65,536個探針。
目前美國Affymetrix公司已有同時檢測6,500個已知人類基因的DNA芯片,并且正在制備含500,000-1,000,000個寡核苷酸探針的人類基因檢測芯片。該公司每月投入基因芯片研究的經費約100萬美元,目前產品尚未公開投放市場發揮經濟效益,但已有許多公司及研究機構與其簽約購買其產品。該產品不僅可用于基因表達分析和基因診斷等,而且在大規模藥物開發方面也具有誘人的前景。Affymetrix的大部分產品將在98年底全面投放市場。屆時,在其產品被廣泛采用的同時,其所有的研究投入將變成巨大的利潤。其它公司產品也正在從實驗室技術研究走向開發應用。目前,用于分子診斷的DNA芯片不僅已可用于檢測愛滋病病毒基因還可用于囊性纖維化(CF)、乳腺癌、卵巢癌等疾病相關基因的基因診斷。鑒于光刻設備技術復雜,只能有專業化公司生產,加之成本高及合成效率不高的問題,因此有待進行以下研究:⑴對光刻技術進行改進,提高合成效率;⑵開發新的原位合成技術,如噴印合成技術,該技術既能進行原位合成又能進行非原位合成。
另一方法是光導原位合成法。具體方法是在經過處理的載玻片表面鋪上一層連接分子(linker),其羥基上加有光敏保護基團,可用光照除去,用特制的光刻掩膜(photolithographic mask)保護不需要合成的部位,而暴露合成部位,在光作用下去除羥基上的保護基團,游離羥基,利用化學反應加上第一個核苷酸,所加核苷酸種類及在芯片上的部位預先設定,所引入的核苷酸帶有光敏保護基團,以便下一步合成。然后按上述方法在其它位點加上另外三種核苷酸完成第一位核苷酸的合成,因而N個核苷酸長的芯片需要4N個步驟。每一個獨特序列的探針稱為一個“feature”,這樣的芯片便具有4N個“feature”,包含了全部長度為N的核苷酸序列。這種原位直接合成的方法無須制備處理克隆和PCR產物,但是每輪反應所需設計的光柵則是主要的經費消耗。運用這種方法制作的芯片密度可高達106探針/平方厘米,即探針間隔為 5-10μm,但只能制作II型 DNA芯片。見圖一。
2 原位噴印合成 芯片原位噴印合成原理與噴墨打印類似,不過芯片噴印頭和墨盒有多個,墨盒中裝的是四種堿基等液體而不是碳粉。噴印頭可在整個芯片上移動并根據芯片上不同位點探針的序列需要將特定的堿基噴印在芯片上特定位置。該技術采用的化學原理與傳統的DNA固相合成一致,因此不特殊制備的化學試劑。
3 點樣法 點樣法是將合成好的探針、cNDA或基因組DNA通過特定的高速點樣機器人直接點在芯片上。點樣分子可以是核酸也可以是寡核酸。一些研究者采用人工點樣的方法將寡核苷酸分子點樣于化學處理后的載玻片上,經一定的化學方法處理非干燥后,寡核苷酸分子即固定于載玻片上,制備好的DNA芯片可置于緩沖液中保存。由于方法費時費力,不適于大規模DNA芯片制作,因而實現自動化點樣就顯得尤為重要。有的研究者用多聚賴氨酸包被固相支待物玻片,經過分區后用計算機控制的微陣列點樣機按照預先設計順序點上核酸分子,點樣量很小,約為5nl。大規模CDNA芯片多采用這種方法,與其寡核苷酸微芯片相比。DNA芯片的潛在優越性是具有更強的親和勢和特異性雜交,但是需要大量制備,純化,量化,分類PCR產物。有的研究者將玻片上覆蓋20μm厚薄層聚丙烯酰胺凝膠作為支持物,采用機械刻寫或光刻的方法在其表面劃上網格,并用激光照射蒸發掉單元間隙的多余凝膠,以實現DNA芯片分區,單元大小為 40×40μm或 100×100μm間隔分別為50μm和100μm。然后將化學方法合成的寡核苷酸探針自動化點樣于各個單元內而制成DNA芯片,點樣速度可達2000單元/秒。
其裝置采用的機器人有一套計算機控制三維移動裝置、多個打印/噴印針的打印/噴印頭;一個減震底座,上面可放內盛探針的多孔板和多個芯片。根據需要還可以有溫度和濕度控制裝置、針洗滌裝置。打印/噴印針將探針從多孔板取出直接打印或噴印于芯片上。直接打印時針頭與芯片接觸,而在噴印時針頭與芯片保持一定距離。打印法的優點是探針密度高,通常1平方厘米可打印2,500個探針。缺點是定量準確性及重現性不好,打印針易堵塞且使用壽命有限。噴印法的優點是定量準確,重現性好,使用壽命長。缺點是噴印的斑點大,因此探針密度低,通常1平方厘米只有400點。國外有多家實驗室和公司研究開發打印/噴印設備,目前有一些已經商品化。軍事醫學科學院和益生堂生物企業公司目前正在聯手利用打印/噴印技術進行生物芯片的研究和開發,預計2年內將有用于實驗室研究或臨床診斷的基因芯片產品問世。見圖二。
4 電子芯片[8-10] 電子芯片是由美國Nanogen公司開發的,目前國內清華大學和復旦大學也在開發這一技術。這種芯片為帶有陽電荷的硅芯片、芯片經熱氧化,制成1mm×1mm的陣列、每個陣列含多個微電極,在每個電極上通過氧化硅沉積和蝕刻制備出樣品池。將連接鏈親和素的瓊脂糖覆蓋在電極上,在電場作用下生物素標記的探針即可結合在特定電極上。電子芯片最大特點是雜交速度快,可大大縮短分析時間。制備復雜、成本高是其不足。
5 三維芯片[11-12] 三維芯片是由美國的Packard、摩托羅拉、Argonne國家實驗室三家機構與俄羅斯Engelhardt分子生物學研究所合作開發的一種芯片技術。三維生物芯片實質上是一塊顯微鏡載玻片,其上有10,000個微小聚乙烯酰胺凝膠條,每個凝膠條可用于靶DNA,RNA和蛋白質的分析。先把乙知化合物加在凝膠條上,再用3cm長的微型玻璃毛細管將待測樣品加到凝膠條上。每個毛細管能把小到0.2nl的體積打到凝膠上。以上幾家機構合作研究的生物芯片系統具有其它生物芯片系統不具有的幾個優點。一是凝膠的三維化能加進更多的已知物質,增加了敏感性。二是可以在芯片上同時進行擴增與檢則。一般情況下,必須在微量多孔板上先進行PCR擴增,再把樣品加到芯片上,因此需要進行許多額外操作。本芯片所用凝膠體積很小。使PCR擴增體系的體積減小1,000倍(總體積約納升級),從而節約了每個反應所用的PCR酶(約減少100倍)。三是以三維構象形式存在的蛋白和基因材料可以其天然狀態在凝膠條上分析,可以進行免疫測定,受體-配體研究和蛋白組分析。
6 流過式芯片(flow-thru chip)[13] Cene Logic正在開發一種在芯片片基上制成格柵狀微通道,Cene Logic設計及合成特定的寡核苷酸探針,結合于微通道內芯片的特定區域。從待測樣品中分離DNA或RNA并對其進行熒光標記,然后,該樣品流過芯片,固定的寡核苷酸探針捕獲與之相互補的核酸,采用Cene Logic's信號檢測系統分析結果。流通式芯片用于高通量分析已知基因的變化,其特定在于⑴敏感性高:由于寡核苷酸吸附表面的增大,流過式芯片可監測稀有基因表達的變化;⑵速度快:微通道加速了雜交反應,減少了每次檢測所需時間;⑶價格降低:由于采用了特殊的共價化學技術將寡核苷酸吸附于微通道內,使每一種流過芯片可反復使用多次,從而使其成本降低。
四.基因芯片樣品制備
一般說來應用DNA芯片進行實驗包括5個過程:生物學問題的提出和芯片設計;樣品制備;生物雜交反應;結果探測;數據處理和建模。
1.樣品制備。一般所需mRNA的量是以一張表達譜芯片需要3μg mRNA計算的
不同組織抽提3-10μg mRNA所需組織量
|
器官/組織* |
提取3μgmRNA所需組織量(克) |
提取10μgmRNA所需織量(克) |
總RNA得率[單位:毫克RNA/克組織] |
mRNA所占百分比[%] |
成人正常組織 |
肝 |
0.2083 |
0.6944 |
1.80 - 1.80 mg/g |
0.80 |
成人正常組織 |
腦 |
缺數據 |
缺數據 |
1.30 - 1.30 mg/g |
缺數據 |
成人正常組織 |
肺 |
0.3000 |
1.0000 |
1.00 - 1.00 mg/g |
1.00 |
成人正常組織 |
心 |
0.5000 |
1.6667 |
0.60 - 0.60 mg/g |
1.00 |
成人正常組織 |
胃 |
0.1852 |
0.6173 |
2.70 - 2.70 mg/g |
0.60 |
成人正常組織 |
喉 |
0.3125 |
1.0417 |
1.20 - 1.20 mg/g |
0.80 |
病理組織 |
結腸癌 |
0.2521 |
0.8403 |
1.70 - 1.70 mg/g |
0.70 |
病理組織 |
胃癌 |
0.4317 |
1.4388 |
0.50 - 0.50 mg/g |
1.39 |
病理組織 |
空腸腺癌 |
0.3571 |
1.1905 |
1.40 - 1.40 mg/g |
0.60 |
病理組織 |
直腸癌 |
0.1604 |
0.5348 |
1.70 - 1.70 mg/g |
1.10 |
病理組織 |
肝癌 |
0.1116 |
0.3720 |
3.84 - 3.84 mg/g |
0.70 |
病理組織 |
肺癌 |
0.1282 |
0.4274 |
2.00 - 2.00 mg/g |
1.17 |
<![endif]>
考慮到個體差異以及樣品在研磨、勻漿等過程中的損失,客戶提供的樣品量應在上述基礎上增加1-2倍。
2 樣本采集過程關鍵點.
組織標本采集操作建議規程,(取標本所需關鍵器材和處理要求 )
鋁箔 |
經DEPC水浸泡過夜,78°C烘干,高壓滅菌后烘干 |
1.5 ml 微離心管 |
市場有售RNAase-Free的相應規格離心管 |
標簽紙 |
|
記號筆 |
|
樣品登記表 |
由客戶指定專人填寫 |
液氮罐 |
應常備液氮罐,并保證液氮的來源 |
取材部位的病理切片 |
由客戶提供1-2張 |
注:
· 以下步驟1 - 5應在冰上進行且不超過15分鐘,超過時間會導致樣品的RNA降解。
· 對腫瘤組織的取材,要求盡可能準確地判定腫瘤和正常組織,例如對于手術切除的整個或部分前列腺,可能要根據冰凍切片報告的結果來判定要進行研究的取材部位。
1 離體新鮮組織,切成多個1cm3小塊,剔除結締組織和脂肪組織。胃、腸組織應剪除外膜;肝、腎、脾應剪除門部血管神經,腫瘤組織應將周圍的正常組織切除干凈(正常組織也應將周圍的腫瘤組織切除干凈)。
2在RNase-Free 0.9%生理鹽水中漂洗樣品,以去除血漬和污物。
3 用鋁箔包裹組織,或用5ml凍存管裝載組織(但最好統一采用鋁箔)。用記號筆在鋁箔或凍存管外表寫明樣品編號,并貼上標簽,迅速投入液氮冷卻。
4 填寫樣品登記表,寫明樣品名稱、種類、編號、取樣日期、樣品處理情況等
將液氮冷卻的組織放入樣品袋(每個樣品袋只保存同樣的組織),袋口留一根編號繩,繩上粘一張標簽紙(標簽上注明:樣品名稱、編號、日期),迅速轉入便攜式液氮罐
5 保留1-2張取材部位的病理切片。
五.生物芯片雜交
待分析基因在與芯片結合探針雜交之前必需進行分離、擴增及標記。根據樣品來源、基因含量及檢測方法和分析目的不同,采用的基因分離、擴增及標記方法各異。當然,常規的基因分離、擴增及標記技術完全可以采用,但操作繁瑣且費時。高度集成的微型樣品處理系統如細胞分離芯片及基因擴增芯片等是實現上述目的的有效手段和發展方向。為了獲得基因的雜交信號必須對目的基因進行標記,目前采用的最普遍的熒光標記方法與傳統方法如體外轉錄、PCR、逆轉錄等原理上并無多大差異,只是采用的熒光素種類更多,這可以滿足不同來源樣品的平行分析。用計算機控制的高分辨熒光掃描儀可獲得結合于芯片上目的基因的熒光信號,通過計算機處理即可給出目的基因的結構或表達信息。
雜交條件的選擇與研究目的有關,多態性分析或者基因測序時,每個核苷酸或突變位點都必須檢測出來。通常設計出一套四種寡聚核苷酸,在靶序列上跨越每個位點,只在中央位點堿基有所不同,根據每套探針在某一特點位點的雜交嚴謹程度,即可測定出該堿基的種類。如果芯片僅用于檢測基因表達,只需設計出針對基因中的特定區域的幾套寡聚核苷酸即可。表達檢測需要長的雜交時間,更高的嚴謹性,更高的樣品濃度和低溫度,這有利于增加檢測的特異性和低拷貝基因檢測的靈敏度。突變檢測,要鑒別出單堿基錯配,需要更高的雜交嚴謹性和更短的時間。
此外,雜交反應還必須考慮雜交反應體系中鹽濃度、探針GC含量和所帶電荷、探針與芯片之間連接臂的長度及種類、檢測基因的二級結構的影響。有資料顯示探針和芯片之間適當長度的連接臂可使雜交效率提高150倍[9]。連接臂上任何正或負電荷都將減少雜交效率。由于探針和檢測基因均帶負電荷,因此影響他們之間的雜交結合,為此有人提出用不帶電荷的肽核酸(PNA)做探針[9]。雖然PNA的制備比較復雜,但與DNA探針比較有許多特點,如不需要鹽離子,因此可防止檢測基因二級結構的形成及自身復性。由于PNA-DNA結合更加穩定和特異,因此更有利于單堿基錯配基因的檢測。
六 基因芯片檢測原理
雜交信號的檢測是DNA芯片技術中的重要組成部分。以往的研究中已形成許多種探測分子雜交的方法,如熒光顯微鏡、隱逝波傳感器、光散射表面共振、電化傳感器、化學發光、熒光各向異性等等,但并非每種方法都適用于DNA芯片。由于DNA芯片本身的結構及性質,需要確定雜交信號在芯片上的位置,尤其是大規模DNA芯片由于其面積小,密度大,點樣量很少,所以雜交信號較弱,需要使用光電倍增管或冷卻的電荷偶連照相機(charged-coupled device camera,CCD)攝像機等弱光信號探測裝置。此外,大多數DNA芯片雜交信號譜型除了分布位點以外還需要確定每一點上的信號強度,以確定是完全雜交還是不完全雜交,因而探測方法的靈敏度及線性響應也是非常重要的。雜交信號探測系統主要包括雜交信號產生、信號收集及傳輸和信號處理及成像三個部分組成。
由于所使用的標記物不同,因而相應的探測方法也各具特色。大多數研究者使用熒光標記物,也有一些研究者使用生物素標記,聯合抗生物素結合物檢測DNA化學發光。通過檢測標記信號來確定DNA芯片雜交譜型。
1.熒光標記雜交信號的檢測方法
使用熒光標記物的研究者最多,因而相應的探測方法也就最多、最成熟。由于熒光顯微鏡可以選擇性地激發和探測樣品中的混合熒光標記物,并具有很好的空間分辨率和熱分辨率,特別是當熒光顯微鏡中使用了共焦激光掃描時,分辨能力在實際應用中可接近由數值孔徑和光波長決定的空間分辨率,而在傳統的顯微鏡是很難做到的,這便為DNA芯片進一步微型化提供了重要的檢測方法的基礎。大多數方法都是在人射照明式熒光顯微鏡(epifluoescence microscope)基礎上發展起來的,包括激光掃描熒光顯微鏡、激光共焦掃描顯微鏡、使用了CCD相機的改進的熒光顯微鏡以及將DNA芯片直接制作在光纖維束切面上并結合熒光顯微鏡的光纖傳感器微陣列。這些方法基本上都是將待雜交對象 以熒光物質標記,如熒光素或麗絲膠(lissamine)等,雜交后經過SSC和SDS的混合溶液或SSPE等緩沖液清洗。
(1)激光掃描熒光顯微鏡
探測裝置比較典型。方法是將雜交后的芯片經處理后固定在計算機控制的二維傳動平臺上,并將一物鏡置于其上方,由氬離子激光器產生激發光經濾波后通過物鏡聚焦到芯片表面,激發熒光標記物產生熒光,光斑半徑約為5-10μm。同時通過同一物鏡收集熒光信號經另一濾波片濾波后,由冷卻的光電倍增管探測,經模數轉換板轉換為數字信號。通過計算機控制傳動平臺X-Y方向上步進平移,DNA芯片被逐點照射,所采集熒光信號構成雜交信號譜型,送計算機分析處理,最后形成20μm象素的圖像。這種方法分辨率高、圖像質量較好,適用于各種主要類型的DNA芯片及大規模DNA芯片雜交信號檢測,廣泛應用于基因表達、基因診斷等方面研究。
(2)激光掃描共焦顯微鏡
激光掃描共焦顯微鏡與激光掃描熒光顯微鏡結構非常相似,但是由于采用了共焦技術因而更具優越性。這種方法可以在熒光標記分子與DNA芯片雜交的同時進行雜交信號的探測,而無須清洗掉未雜交分子,從而簡化了操作步驟大大提高了工作效率。Affymetrix公司的S.P.A.Forder等人設計的DNA芯片即利用此方法。其方法是將靶 DNA分子溶液放在樣品地中,芯片上合成寡核苷酸陣列的一面向下,與樣品池溶液直接接觸,并與DNA樣品雜交。當用激發光照射使熒光標記物產生熒光時,既有芯片上雜交的DNA樣品所發出的熒光,也有樣品地中DNA所發出的熒光,如何將兩者分離開來是一個非常重要的問題。而共焦顯微鏡具有非常好的縱向分辨率,可以在接受芯片表面熒光信號的同時,避開樣品池中熒光信號的影響。一般采用氬離子激光器(488nm)作為激發光源,經物鏡聚焦,從芯片背面入射,聚集于芯片與靶分子溶液接觸面。雜交分子所發的熒光再經同一物鏡收集,并經濾波片濾波,被冷卻的光電倍增管在光子計數的模式下接收。經模數轉換反轉換為數字信號送微機處理,成像分析。在光電信增管前放置一共焦小孔,用于阻擋大部分激發光焦平面以外的來自樣品池的未雜交分子熒光信號,避免其對探測結果的影響。激光器前也放置一個小孔光闌以盡量縮小聚焦點處光斑半徑,使之能夠只照射在單個探針上。通過計算機控制激光束或樣品池的移動,便可實現對芯片的二維掃描,移動步長與芯片上寡核苷酸的間距匹配,在幾分鐘至幾十分鐘內即可獲得熒光標記雜交信號圖譜。其特點是靈敏度和分辨率較高,掃描時間長,比較適合研究用。現在 Affymetrix公司已推出商業化樣機,整套系統約 12萬美元。
(3)采用了CCD相機的熒光顯微鏡
這種探測裝置與以上的掃描方法都是基于熒光顯微鏡,但是以CCD相機作為信號接收器而不是光電倍增管,因而無須掃描傳動平臺。由于不是逐點激發探測,因而激發光照射光場為整個芯片區域,由CCD相機獲得整個DNA芯片的雜交譜型。這種方法一般不采用激光器作為激發光源,由于激光束光強的高斯分布,會使得光場光強度分布不均,而熒光信號的強度與激發光的強度密切相關,因而不利于信號采集的線性響應。為保證激發光勻場照射,有的學者使用高壓汞燈經濾波片濾波,通過傳統的光學物鏡將激發光投射到芯片上,照明面積可通過更換物鏡來調整;也有的研究者使用大功率弧形探照燈作為光源,使用光纖維束與透鏡結合傳輸激發光,并與芯片表面呈50o角入射。由于采用了CCD相機,因而大大提高了獲取熒光圖像的速度,曝光時間可縮短至零點幾秒至十幾秒。其特點是掃描時間短,靈敏度和分辨率較低,比較適合臨床診斷用[14].
(4)光纖傳感器
有的研究者將 DNA芯片直接做在光纖維束的切面上(遠端),光纖維束的另一端(近端)經特制的耦合裝置耦合到熒光顯微鏡中。光纖維束由7根單模光纖組成。每根光纖的直徑為200μm,兩端均經化學方法拋光清潔。化學方法合成的寡核苷酸探針共價結合于每根光纖的遠端組成寡核苷酸陣列。將光纖遠端浸入到熒光標記的靶分子溶液中與靶分子雜交,通過光纖維束傳導來自熒光顯微鏡的激光(490urn),激發熒光標記物產生熒光,仍用光纖維束傳導熒光信號返回到熒光顯微鏡,由CCD相機接收。每根光纖單獨作用互不干擾,而溶液中的熒光信號基本不會傳播到光纖中,雜交到光纖遠端的靶分子可在90%的甲酸胺( formamide)和TE緩沖液中浸泡10秒鐘去除,進而反復使用。這種方法快速、便捷,可實時檢測DNA微陣列雜交情況而且具有較高的靈敏度,但由于光纖維束所含光纖數目有限,因而不便于制備大規模DNA芯片,有一定的應用局限性。
2..生物素標記方法中的雜交信號探測
以生物素(biotin)標記樣品的方法由來已久,通常都要聯合使用其它大分子與抗生物素的結合物(如結合化學發光底物酶、熒光素等),再利用所結合大分子的特殊性質得到最初的雜交信號,由于所選用的與抗生物素結合的分子種類繁多,因而檢測方法也更趨多樣化。特別是如果采用尼龍膜作為固相支持物,直接以熒光標記的探針用于DNA芯片雜交將受到很大的限制,因為在尼龍膜上熒光標記信號信噪比較低。因而使用尼龍膜作為固相支持物的這些研究者大多是采用生物素標記的。
目前應用較多的是美國General Scanning公司開發的基因芯片專用檢測系統(ScanArray 3000),采用激光共聚焦掃描原理進行熒光信號采集,由計算機處理熒光信號,并對每個點的熒光強度數字化后進行分析。近期又開發出了ScanArray 5000,其掃描精度和功能有較大的提高。
七 結果的分析
樣品在被測定前,首先要經過消化,使待測組織細胞中的DNA或RNA釋放出來,在經過適當的擴增后,以熒光標記物標記,放入基因芯片自動孵育裝置(Fluidics Station)中,由其自動控制反應的時間、溫度以及緩沖液的配比等反應條件,進行雜交,這一過程,僅需要數秒鐘。雜交完成后,要對基因芯片進行“讀片”,即應用激光共聚焦熒光掃描顯微鏡,對基因芯片表面的每個位點進行檢測。這種顯微鏡,將聚焦的平面設定為芯片的表面,因此可以檢測結合到芯片表面位點的樣品片斷的熒光標記,而待測樣品中未與芯片上探針結合的熒光標記物,則懸浮于溶液中,由于不在聚焦平面上,因而不被檢測。樣品與探針的錯配是影響雜交反應結果的重要因素,但由于樣品與芯片上的探針正確配對時產生的熒光信號要比錯配時強的多,因此,通過對信號強度的分析,就可以區分正確與錯誤的配對。
為了使結果的檢驗更加簡便和快速,Affymetrix的基因芯片的分析系統中采用了基因陣列掃描儀和專用的基因芯片工作站,對一幅包含數萬個探針位點的基因芯片圖樣的分析,僅需要數分鐘的時間。這樣在短短的幾十分鐘至數小時內,就可以完成用傳統方法需要數月才能完成的幾萬乃至幾十萬次雜交分析試驗。
八 基因芯片的應用
(一)基因表達分析 基因芯片具有高度的敏感性和特異性,它可以監測細胞中幾個至幾千個mRNA拷貝的轉錄情況。與用單探針分析mRNA的點雜交技術不同,基因芯片表達探針陣列應用了大約20對寡核苷酸探針來監測每一個mRNA的轉錄情況。每對探針中,包含一個與所要監測的mRNA完全吻合和一個不完全吻合的探針(圖2),這兩個探針的差別在于其中間位置的核苷酸不同。這種成對的探針可以將非特異性雜交和背景訊號減小到最低的水平,由此我們就可以確定那些低強度的mRNA。目前,Affymetrix公司已經生產出HugeneFL、Mu6500(含有小鼠6 500個基因)、Ye6100(含有酵母6 100個基因)等基因芯片成品。
1 分析基因表達時空特征。英國劍橋大學Whitehead研究所的Frank C.P. Holstege等人,應用含有酵母基因組的基因芯片,深入研究了真核細胞基因組的調節周期。應用基因組水平的表達分析,監測那些表達受轉錄起始機制的關鍵成分控制的基因,發現RNA聚合酶II、主要的轉錄因子TFIID和SAGA染色體修飾復合物等均在基因的表達中有自己特定的作用位點[15]。通過本試驗,研究人員揭示了:(1)基因特異性的轉錄因子對表達的調控作用。(2)細胞在缺乏營養的環境中,基因不同位點的協同調節作用的全新機制。(3)信號轉導通路的最終作用位點,在最初的幾步中就可以確定。以此試驗為基礎,研究人員進一步繪制出了酵母基因組控制圖,并由此分析出了各種調節因子在基因上不同的作用位點和其作用的分子機制。
美國Stanford大學的V.R.Iyer等人[16],對成纖維細胞中與細胞增生和損傷修復有關的基因進行了分析。首先,他們用成纖維細胞中的8 600個基因片斷制成基因芯片的探針陣列,通過與mRNA反轉錄形成的cDNA的雜交反應,可以判斷出該基因的活性。在試驗中,成纖維細胞被置于無營養的環境中,使絕大部分基因的活性關閉,兩天后,加入10%的血清,24小時內,分6個不同的時間點,觀察基因的活化情況。試驗結果表明,在所有被監測的基因中,約有500個基因最為活躍,而使細胞保持不分裂狀態的基因活性被抑制。其中,最早被活化的是那些轉錄調控基因。在活化的基因中,有28個基因共同作用,控制細胞的增殖;8個與免疫反應的激活有關;19個與血管重建有關;另有許多基因,與血管新生密切相關。在腫瘤細胞中,基因的表達與正常的細胞存在著明顯的差異。通過基因芯片繪出基因表達的時空圖譜,有助于人類認識生命活動過程和特征。
2 基因差異表達檢測〔17〕 生命活動中基因表達的改變是生物學研究的核心問題。理解人類基因組中10萬個不同的基因功能,監測某些組織、細胞不同分化階段的差異基因表達(differential gene expression ,DGE)十分重要。對差異表達的研究,可以推斷基因與基因的相互關系,細胞分化中基因“開啟”或“關閉”的機制;揭示基因與疾病的發生、發展、轉歸的內在聯系。目前DGE研究方法主要有表達序列標簽(ESTs)測序、差減克隆(subtractive cloning )、差異顯示(differential display)、基因表達系列分析 (serial analysis of gene expression, SAGE)。而cDNA微陣列雜交技術可監測大量mRNA的轉錄,直接快速地檢測出極其微量的mRNA,且易于同時監測成千上萬的基因,是研究基因功能的重要手段之一。Rihn BH等利用基因芯片檢測胸膜間皮瘤與正常細胞間比較了6500個基因,,發現了300多個差異基因的表達。其中幾個典型基因的表達經RT-PCR進行定量后,可作為胸膜間皮瘤診斷的標記物(Markers)[18]。Sgroi〔19〕報告DNA芯片結合激光捕獲顯微切割技術(laser capture microdissection)用于乳癌浸潤期和轉移期及正常細胞的基因表達譜(gene expression profiles)差異研究,結果被定量PCR和免疫組化所證實。差異表達有助于早期發現瘤細胞3萬個基因與正常細胞的區別,有助于了解瘤細胞的發生、浸潤、轉移和藥敏。最近,美國毒物化學研究所(CIIT) 和國家環境健康科學研究所(NIEHS)正計劃在一張玻片上建立8 700個小白鼠cDNA芯片,用于肝癌的研究。我國也已成功研制出能檢出41 000種基因表達譜的芯片。美國Stanford大學的David Botstein利用cDNA微陣列芯片,對乳腺癌細胞的基因表達進行了分析,發現其基因表達水平明顯低于正常細胞。利用基因芯片對表達進行分析,在一次試驗中可以獲取相當于在60余萬次傳統的Northern雜交中所獲得的關于基因表達的信息。通過這種實驗方法,可以建立一種全新的腫瘤分類學方法,即依據每個腫瘤細胞中的基因表達情況對腫瘤細胞進行分類。基因芯片技術在分析基因的表達中具有不可比擬的優勢。
3 發現新基因 Moch等利用腫瘤微陣列芯片(5 184個cDNA片段)發現了腎細胞癌的腫瘤標志物基因,并于正常細胞進行比較。在532份標本中檢測到胞漿纖維Vimentin的表達基因,陽性率為51%~61%〔20〕。追蹤觀察,有Vimentin表達的患者,預后極差。人類大量ESTs給cDNA微陣列提供了豐富的資源,數據庫中400 000個ESTs代表了所有人類基因,成千上萬的ESTs微陣列將為人類基因表達研究提供強有力的分析工具。這將大大地加速人類基因組的功能分析〔21〕。
定量檢測大量基因表達水平在闡述基因功能、探索疾病原因及機理、發現可能的診斷及治療靶等方面是很有價值的。如該技術在炎癥性疾病類風濕性關節炎(RA)和炎癥性腸病(IBD)的基因表達研究中,由RA或IBD組織制備探針,用Cy3和Cy5熒光素標記,然后與靶cDNA微陣列雜交,可檢測出炎癥疾病誘導的基因如TNF-α、IL或粒細胞集落刺激因子,同時發現一些以前未發現的基因如HME基因和黑色素瘤生長刺激因子。Schena等人[22]報道了cDNA的微陣列在人類基因表達監測、生物學功能研究和基因發現方面的應用。采用含1,046個已知序列的cDNA微陣列,用高速機器人噴印在玻片上,用雙色雜交法定量監測不同基因表達,在一定的實驗條件下,不同表達模式的陣列成分通過序列分析鑒定其特征。該方法較以往常用的方法敏感10倍以上,檢測限度為1:500,000(wt/wt)總人體mRNA。在培養T細胞熱休克反應的測定中,發現17個陣列成分的熒光比較明顯改變,其中11個受熱休克處理的誘導,6個呈現中度抑制,對相應于17個陣列成分的cDNA測序發現5個表達最高的成分是5種熱休克蛋白,17個克隆中發現3個新序列。另外,在佛波酯誘導檢測中[23],發現有6個陣列成分信號增強超過2倍,測序及數據庫比較揭示有5個已知的,誘導表達最高的兩個是PCA-1酪氨酸磷酸酶和核因子-κB1,有一個是未知的。這4個新基因的表達水平均相對較低,僅呈現2倍的誘導。Northern雜交結果證實了微陣列的結果。進一步檢測了人的骨髓、腦、前列腺及心臟組織中熱休克和佛波酯調節基因的表達,4種組織中檢測出15種熱休克和佛波酯調節基因的表達,其表達水平與Jurkat細胞中相應成分的表達水平密切相關如在四種組織中表達水平最高的兩個基因β-actin和細胞色素C氧化酶在Jurkat細胞中的表達水平也很高。上述實驗提示在缺乏任何序列信息的條件下,微陣列可用于基因發現和基因表達檢測。目前,大量人類ESTs給cDNA微陣列提供了豐富的資源,數據庫中400,000個ESTs代表了所有人類基因,成千上萬的ESTs微陣列將為人類基因表達研究提供強有力的分析工具。這將大大地加速人類基因組的功能分析。
4 大規模DNA測序 人類基因組計劃的實施促進了高效的、自動化操作的測序方法的發展。芯片技術中雜交測序(sequencing by hybridization, SBH)技術及鄰堆雜交(contiguous stacking hybridization, CSH)技術即是一種新的高效快速測序方法[24-26]。用含65 536個8聚寡核苷酸的微陣列,采用SBH技術,可測定200 bp長DNA序列,采用67 108 864個13聚寡核苷酸的微陣列,可對數千個堿基長的DNA測序。SBH技術的效率隨著微陣列中寡核苷酸數量與長度的增加而提高,但微陣列中寡核苷酸數量與長度的增加則提高了微陣列的復雜性,降低了雜交準確性。CSH技術彌補了SBH技術存在的弊端,CSH技術的應用增加了微陣列中寡核苷酸的有效長度,加強了序列準確性,可進行較長的DNA測序。計算機模擬論證了8聚寡核苷酸微陣列與5聚寡核苷酸鄰堆雜交,相當于13聚寡核苷酸微陣列的作用,可測定數千個核苷酸長的DNA序列[26]。Dubiley等人[26]將合成的10聚寡核苷酸固定于排列在載片表面的0.1×0.1×0.02mm或1×1×0.02mm聚丙酰胺凝膠墊上制備聚寡核苷酸微陣列,先用分離微陣列(fractionation chips)進行單鏈DNA分離,再用測序微陣列(sequencing chips)分析序列,后者聯合采用了10聚寡核苷酸微陣列的酶促磷酸化、DNA雜交及與鄰堆的5聚寡核苷酸連接等技術。該方法可用于含重復序列及較長序列的DNA序列測定及不同基因組同源區域的序列比較。利用基因芯片測序的準確率達99%以上。
正如NIH首腦Harold Varmus在美國細胞生物學1998年年會上所說:“在基因芯片的幫助下,我們將能夠監測一個細胞乃至整個組織中所有基因的行為。”
(二)基因型、基因突變和多態性分析
在同一物種不同種群和個體之間,有著多種不同的基因型,而這種不同,往往與個體的不同性狀和多種遺傳性疾病有著密切的關系。通過對大量具有不同性狀的個體的基因型進行比較,就可以得出基因與性狀的關系。但是,由于大多數性狀和遺傳性疾病是由多個基因同時決定的,因此分析起來就十分困難,然而基因芯片技術恰恰解決了這一問題,利用其可以同時反應數千甚至更多個基因的特性,我們就可以分析基因組中不同基因與性狀或疾病的關系。美國Stanford大學的E.A.Winzeler等[27],以兩種不同菌株的酵母(S96和YJM789)作為實驗材料,對控制酵母對放線菌酮的抗藥性的基因進行分析。將含有酵母150 000個DNA片斷的基因芯片分別與這兩株酵母活化轉錄的mRNA分子雜交,S96幾乎全部吻合,而YJM789與芯片上的探針組存在較大的差異,約有3000個位點沒有雜交顯色。由于S96對放線菌酮有抗藥性而YJM789的抗藥性則弱的多,因此可以判定控制這一抗藥性的基因的所在。而后,通過對S96和YJM789雜交后產生的抗藥子代的遺傳標記的分析,進一步確定,控制該抗藥性的基因位于15號染色體,是一長約57 000個堿基的片斷。美國國家人類基因組研究室的J.G.Hacia等在Fodor研究小組的協助下[28],將基因芯片應用于雙色突變分析。他們的分析對象是與人類遺傳性乳腺癌和卵巢癌密切相關的BRCA1基因的外顯子11。在擴增后,將BRCA1基因的外顯子11置于含有熒光素-12-UTP的環境中進行體外轉錄反應,而后將轉錄產生的mRNA與BRCA1外顯子11芯片雜交,4小時后,用藻紅蛋白染色。在觀察時,用488nm的氬離子激光進行掃描,熒光染色位點呈現綠色,而藻紅蛋白染色的位點呈現紅色。應用雙色分析,可以更為清楚的監測未知樣品與標準鏈之間的競爭性雜交情況,進而分析該基因中的不同突變。通過對15名患者BRCA1基因的觀察,有14名患者在外顯子11位點存在不同的突變。Hacia等[29]在1.28 cm×1.28 cm的芯片上固定了9.66×104個長度為20 nt的寡核苷酸探針,用于檢測乳腺癌基因BRCA1的exon11 (3.45 kb)中所有可能的堿基置換、插入和缺失(1~5 bp)突變。針對每一個位點,共有28個獨立的探針,14個針對有義鏈,14個針對反義鏈。14個探針包括2個野生型,3個堿基置換、4個插入突變、5個堿基缺失。在15例患者樣品中,發現有14例有基因突變,類型包括點突變、插入及缺失等;在20例對照樣品中均未檢出假陽性結果,結果表明DNA芯片技術可快速、準確地研究大量患者樣品中特定基因所有可能的雜合變。Cronin等[30]分別用兩種DNA芯片檢測囊性纖維化跨膜傳導調節(CFTR)的突變,其中一個芯片包含1 480個探針,檢測了CFTR基因的第10和11外顯子的已知突變,包括缺失、插入和單堿基置換,并分析了10個未知樣品的CFTR基因,其結果與PCR-RELP的分析結果完全一致。
Guo等人[31]利用結合在玻璃支持物上的等位基因特異性寡核苷酸(ASOs)微陣列建立了簡單快速的基因多態性分析方法。將ASOs共價固定于玻璃載片上,采用PCR擴增基因組DNA,其一條引物用熒光素標記,另一條引物用生物素標記,分離兩條互補的DNA鏈,將熒光素標記DNA鏈與微陣列雜交,通過熒光掃描檢測雜交模式,即可測定PCR產物存在的多種多態性,該方法對人的酪氨酸酶基因等4個外顯子內含有的5個單堿基突變進行分析,結果顯示單堿基錯配與完全匹配的雜交模式非常易于區別。這種方法可快速、定量地獲得基因信息。β-地中海貧血中變異的檢測也論證了該方法的有效性和可信性[32]。Lipshutz等人[33]采用含18,495個寡核苷酸探針的微陣列,對HIV-1基因組反轉錄酶基因(rt)及蛋白酶基因(pro)的高度多態性進行了篩選。微陣列中內部探針與靶序列的錯配具有明顯的不穩定性,據此可快速區別核酸靶的差異。例如檢測序列5'GTATCAGCATXGCCATCGTGC中X堿基的種類,可用下列4種探針3'AGTCGTAACGGTAGC,3'AGTCGTACCGGTAGC,3'AGTCGTAGCGGTAGC,3'AGTCGTATCGGTAGC。高密度探針陣列可檢則具有特征性的較長序列相關的多態性與變異。篩選1,000個核苷酸序列的變異與多態性需要4,000個探針。用100μm合成位點,設計1.28cm2陣列,將有大約16,000個探針,能篩選4kb序列。HIV-1基因組中rt與pro在疾病過程中易于發生多種變異,這些變異將導致病毒對多種抗病毒藥物包括AZT、ddI、ddC等出現明顯抗性,因此檢測和分析rt與pro的變異與多態性具有重要的臨床意義。隨著遺傳病與癌癥相關基因發現數量的增加,變異與多態性分析將越來越重要。Chee等[34]用含有1.35×105個長度為25 nt的寡核苷酸探針,分析了16.6 kb的人類線粒體基因組DNA(mt DNA),共分析了10個樣本,檢測出了505個多態性位點,并在Leber′s遺傳性視神經疾病患者的mt DNA中檢測出3個致病性突變位點。
隨著人類基因組計劃的逐步發展,研究人員分析出了越來越多的基因序列。下一步,就是要分析這些基因的多態性與生物功能和疾病的關系,而這需要對大量個體進行分析。通過基因芯片SNP(單核苷酸多態性)定位試驗,可以確定基因多態性和疾病的關系,同時也可確定致病的機制和病人對治療的反應等。同樣,對于許多與人類疾病密切相關的致病微生物,也可對其進行基因型和多態性分析,1998年,法國T.Livache等[35]就成功的利用基因芯片技術,對人血中的HCV病毒進行了基因型分析。SNP基因芯片的成功將使臨床診斷上到一個新的臺階。
(三)疾病的診斷與治療 人類的疾病與遺傳基因密切相關,基因芯片可以對遺傳信息進行快速準確的分析,因此它在疾病的分子診斷中的優勢是不言而喻的,就臨床一種新的、強有力的分子工具[36]。基因芯片技術已經被應用于感染性疾病、腫瘤和藥物代謝等方面的研究。
1 遺傳病相關基因的定位 90年代以來,隨著人類基因組計劃的發展,各種方法被相繼創立并應用到基因定位中。我國有4 000萬育齡婦女,每年有2 000萬新生兒,準確檢測遺傳病基因是優生優育的技術保障。DNA芯片充分結合并靈活運用了大規模集成電路制造技術、自動化技術、計算機及網絡技術、激光共聚焦掃描、DNA合成、熒光標記探針、分子雜交及分子生物學的其它技術,在這一領域的研究中有著巨大的潛力。這一技術已成為基因定位研究的高效工具。隨著遺傳病與癌癥相關基因發現數量的增加,變異與多態性分析將越來越重要。HGP使許多遺傳疾病基因得以定位,配合使用多位PCR (multiplex-PCR) /DNA芯片可一次篩查多種遺傳病,既經濟快速又敏感可靠[37,38]。
2 腫瘤診斷 已用基因芯片檢測人鼻咽癌、肺癌基因表達譜、腫瘤原癌基因和抑癌基因的發現和定位。早在1996年,M.J.Kozal等就利用基因芯片[39],對HIV-I B亞型中的蛋白酶基因的多態性進行了分析,這也是基因芯片技術被首次應用于臨床實踐。在艾滋病的治療中,使用HIV蛋白酶抑制劑是一種重要的手段。然而,病毒對該藥物的反應卻有著很大的差異。利用基因芯片技術,研究人員分析了取自102個病人的167個病毒單體,發現這些同為美國HIV-I B亞種的病毒的基因序列存在極大差異,其中蛋白酶的基因片斷差異最大,在編碼99個氨基酸的序列中,竟有47.5%存在明顯突變。這些氨基酸的突變,直接導致了病毒抗藥性的不同。含96 600個20體寡核苷酸高密度陣列對遺傳性乳腺和卵巢癌BRCA1基因3.45 kb的第11個外顯子進行雜合變異篩選,15個患者的已知變異的樣品中,準確診斷出14個患者,20個對照樣品中未發現假陽性。用Affimetrix p53芯片和PCR-SSCP調查42例有乳癌史的家系,p53基因13 964位的G變為C,突變率為7.1%;無乳癌家族史者為0。Favis等用多位PCR/連接酶檢測反應(PCR/LDR)在一個試管內同時檢測數百個基因突變,用于檢測大腸癌組織k-ras 和p53突變及BRCA-1和BRCA-2低頻率突變收到良好效果。
人類惡性腫瘤中,約有60%與人類p53抑癌基因的突變有關,目前研究人員已經研制成功了可以檢測p53基因所有編碼區(外顯子2~外顯子11)錯意突變和單堿基缺失突變的基因芯片。以外顯子7的第248個密碼子為例,野生型為CGG,在芯片上做出5條探針,相應位點分別為GAC、GCC、GGC、GTC和G-C,根據雜交后的熒光顯色圖,就可以分析出該位點為何種突變。
3 感染性疾病的診斷 HIV-1基因組中rt與pro在疾病過程中易于發生多種變異,這些變異將導致病毒對多種抗病毒藥物包括AZT、ddI、ddC等出現明顯抗性,因此檢測和分析rt與pro的變異與多態性具有重要的臨床意義。Hayward[40]以3 648個插入片段建立獵槍微陣列(shotgun microarray),通過差異雜交和DNA測序找到了瘧原蟲無性和有性生殖階段基因差異表達,為抗瘧藥設計提供了線索。可以預測在不久的將來,人們可望在一張DNA芯片上檢測幾乎所有的病原微生物基因,實現真正意義上的“組合檢測(profile tests)”。
4 耐藥菌株和藥敏檢測 據WHO報告,全球每年約有800萬結核病患者,有300萬人死亡,死亡人數超過了艾滋病和瘧疾的總和。主要原因是菌株對不同的藥物產生了抗藥性(俄國80%TB對一種藥物產生抗性;美國50%為多重耐藥)。對每例患者進行菌株和藥敏鑒定是控制TB的關鍵。最近,俄美兩國科學家開發了具此功能的基因芯片,可使醫生及早使用敏感藥物。該芯片(TB Biochips)將抗性菌株的單鏈DNA標記后固定在玻片上,與待檢TB株雜交,臨床使用未見假陽性,該芯片可清洗后重復使用50次。
(四)藥物研究中的應用
從經濟效益來說,最大的應用領域可能是制藥廠用來開發新藥。所以已經有多家制藥企業介入芯片的開發。如: Incyte Pharmaaceuticals Inc.,Sequana Therapeutics,Millenium Pharmaceuticals Inc.等。對于尋找新藥來說,目標之一是應用芯片可以在基因水平上尋找藥物靶標。采用所謂“譯碼器”策略(Decoder strategy)來確定藥物靶標。從而找到“導向藥物”。基因芯片也被用于尋找蛋白激酶抑制物。細菌或腫瘤組織的耐藥性也涉及基因改變可以用DNA芯片鑒定。
1 新藥開發 高通量的DNA芯片可發現眾多的新基因和新的靶分子用于新藥的設計。噬菌體展示技術可創造大量蛋白質,目前多用于抗體庫的建立和篩選,進而可用于受體-配體相互作用的研究。基因組學、蛋白質組學和生物信息學(bioinformatics)將大大促進制藥工業的發展。目前第一個生物分子工程藥物Herceptin已用于乳癌的治療,并獲得美國FDA的批準。除腫瘤外,用分子生物工程設計的藥物可用于治療遺傳病及代謝疾病、抗衰老、設計新的抗生素和工業用酶等。
同時,有時一種藥物的作用是多方面的,基因芯片有助于發現一種藥物的新的功能。原先設想的作用是針對某一靶標的,但在全基因或廣范圍篩選中卻發現該藥在另一方面有很強的抑制作用,從而開發成另一種新藥。
2 調查藥物處理細胞后基因的表達情況
基因芯片在用來研究藥物的作用機理時十分有用。Marton[40]等人利用基因芯片構建了免疫抑制性藥物FK506處理酵母細胞后的基因表達圖譜。發現用FK506處理的酵母細胞基因表達圖譜與FK506靶標的無意義突變體相似。而用FK506去處理此突變體,發現了不同于野生型的作用機制。Clarke等[41]用基因芯片研究了腸癌患者化療前和治療期間腫瘤基因表達情況,發現絲裂霉素C和5-氟尿嘧啶治療均可使糖苷合成酶和尿嘧啶-DNA糖基酶的基因表達增加。該研究提示,這類研究既有助于闡明藥物的作用機制,也有助于確定藥物作用的靶基因,為新藥研究, 提供線索。
3 對藥物進行毒性評價
應用芯片查找藥物的毒性或副作用,進行毒理學研究。尤其是慢性毒性和副作用,往往涉及基因或基因表達的改變。如果藥物能抑制重要基因的表達,則對它的深入研究就值得考慮。用芯片作大規模的表達研究往往可省略大量的動物試驗。若某個正在篩選的潛在藥物作用靶細胞得到的基因表達圖譜與已知的具有毒性副作用的藥物得到的基因表達圖譜相似時,就要考慮是否停止藥物開發(drug development)中花費巨大的臨床實驗階段。Nuwaysir等[42]研制了包括涉及細胞凋亡、DNA復制和修復、氧化應激/氧化還原內穩態、過氧化物酶體增殖反應、二?英/多環芳烴反應、雌激素反應、看家基因、癌基因和抑癌基因、細胞周期控制、轉錄因子、激酶、磷酸酶、熱休克蛋白、受體、細胞色素P450等共2 090個基因的毒理芯片(ToxChip v1.0), 該芯片既可用于毒物的檢測和遺傳多態性的檢測,又可用于受檢毒物的毒作用機制的研究。最近,Holden等從人和小鼠文庫中選擇約600個與毒理學相關基因的cDNA克隆,制備了種屬特異的毒理基因組學芯片,可研究肝臟毒性、內分泌干擾、致癌作用等毒性終點的作用機制,也可用于確定以基因表達模式為基礎的化合物的毒性。
(五)基因芯片中醫學領域中的應用
中醫學中應用基因芯片技術,還處于初始階段,目前主要集中以下三個方面:
1中藥的研究,具體的方法,同上述藥物篩選方法類似。尤其中藥中眾多成分中有效成分的篩選、有效藥物的篩選、中藥毒理學過程均被大大簡化,將推動中藥的迅猛發展。中藥學引入基因芯片技術,將大大推動中藥研究的國際化進程,為闡明中藥作用機理,具有無可估量的重要意義。
2中醫“證”本質的研究。中醫“證”的中醫藥的臨床治療的核心,但“證”的本質研究一直難以有重大進展。主要因為中醫理論設及到生命的整體,因而它牽涉到許多基因和蛋白質,傳統的方法學無法弄清“證”的實質,而利用基因芯片技術,對不同“證”狀態的基因組進行掃描,再繪出不同證的基因表達譜,通過相關分析,可望獲得一些有意義的成果。也是從分子基因水平全面揭示“證”本質提供了可能。如果證本質被揭示,它可能會引起醫學治療學理論的重大革新或變化,尤其是個體化治療方案可能重新被重視。
3針灸原理研究。針灸的原理設及全身各個部分,針灸不同方法、不同穴位、經絡是否具有不同的作用,也即經脈與臟腑間的相關聯系是否具有相對特異性。通過基因芯片測量不同組織基因表達的差異,判斷基因表達是否具有特異性,有望解決這一長期爭論不休的問題。如果心經與心臟具有相對特異性,那么針刺心經后,心臟內可能會出現某些與針刺相關的特異性基因表達,而且,這種表達只在針刺心經時出現,這些基因可能不在其它器官,如肝臟中表達。那么可以肯定地認為經脈臟腑相關是具有相對特異性的,也可以認為傳統經絡理論是有依據的。
另一方面,基因芯片還有助于揭示針灸的作用機制。針灸的作用是與神經內分泌免疫網絡系統(NEI networks)密切相關的,它設及到細胞信使、神經遞質、調質、神經肽、細胞因子、內分泌激素等多種因子,但針灸的信號是如何在細胞間和細胞內傳遞的過程仍不明朗,如果引入基因芯片,可以高通量的檢測細胞內基因表達的時空特征,有助于了解針灸促進基因表達的特點,進而再利用蛋白組學相關技術,揭示針灸作用原理。現在已有部分工作正在進行。
(六)其它應用
1環境化學毒物的篩選 我們的生活環境中存在著數千種化學物質,每種物質在投入使用前必須進行人體毒性試驗,傳統的動物試驗費用高昂,且存在著國際上關注的動物福利(animal welfare)問題。采用毒物檢測芯片(Toxchips)可對環境中眾多化學物質對人類基因的潛在毒性進行篩選,探查毒物“開啟”或“關閉”哪些基因,研究“環境如何改變我們的基因”。NIEHS將對人類100 000個基因中的12 000個基因進行檢測,弄清致癌物質對基因的改變,建立化學物質指紋庫(fingerprints of chemicals),然后即可通過測定特定基因的突變與否判斷新的合成物質的生物毒性。
2體質醫學的研究。體質醫學關系到個體化治療的核心問題,不同的人具有不同的體質基礎,其原因與基因型可能存在一定的相關性,尤其可能與SNP關系較大,如何全面了解人的SNP差異,以及它與體質因素、疾病的易感性間關系,是值得研究的重大課題。
九 國內外基因芯片生產情況
美國繼開展人類基因組計劃以后,于1998年正式啟動基因芯片計劃,美國國立衛生部、能源部、商業部、司法部、國防部、中央情報局等均參與了此項目。同時斯坦福大學、麻省理工學院及部分國立實驗室如Argonne Oakridge也參與了該項目的研究和開發。英國劍橋大學、歐亞公司正在從事該領域的研究。世界大型制藥公司尤其對基因芯片技術用于基因多態性、疾病相關性、基因藥物開發和合成或天然藥物篩選等領域感興趣,都已建立了或正在建立自己的芯片設備和技術。目前全世界有幾百家基因芯片公司,有多種生物芯片問世,而且這些芯片的特點較以前密度更高,檢測方法更精確,特異性更強的特點。而主要仍以少數幾家公司為主,如Affymetrix、Brax、Hysep等。國內目前主要如清華大學(陳京)、中科院生命科學院、上海復旦大學、北京軍事科學院、南京東南大學、西安等四十余家公司,而且可能還有一大批公司相繼成立。
主要DNA芯片高科技術企業的開發善和各自技術特點(1998年)[43]
<![endif]>
公司 |
排陣方法 |
結果讀出 |
主要方向 |
Affymetrix(Santa Clara,CA) |
單片照相平板印刷法在1.25cm2或5.25cm2薄硅片上合成20~25mer寡核苷酸 |
熒光 |
表達譜,多態性分析,診斷 |
Brax(Cambridge,UK) |
短合成寡核苷酸,離片合成 |
質譜儀 |
表達譜,新基因鑒定,診斷 |
Hysep(Sunnyvale,CA) |
500~2000nt的DNA樣品打印在0.6cm2(HyGnostics)或~18cm2(Gene Discovery)的膜上 預制5mer寡核苷酸在玻璃上打印或1.15cm2陣列(HyChip) |
放射性同位素 熒光 |
表達譜,新基因鑒定,診斷(HyGnostics/ HyChip Array) |
Incyte Pharmaceuticals(Palo,Alto,CA) |
噴墨式打印PCR片段和在片合成 |
熒光和放射性同位素
|
表達譜,多態性分析,診斷 |
Molecular Dynamics(Sunnyvale,CA) |
筆式撈錢500~5000nt cDNAs于玻璃片上~10cm2` |
熒光 |
表達譜,新基因鑒定 |
Nanogen (San Diego,CA) |
電活性點捕捉預制的~20mer寡核苷酸到≤1cm2硅膜薄片上 |
熒光 |
診斷短片段串聯重復序列鑒定 |
Protogene Laboratories (Palo,Alto,CA) |
通過打印表面張力陣列在片合成40~50mer寡核苷酸于9cm2玻璃片上 |
熒光 |
表達譜,多態性分析 |
Sequenom(Hamburg,Germany and San Diego,CA) |
背面蹭臟膠印法陣列;20~25mer |
質譜儀 |
新基因鑒定,侯選基因確證,診斷,作圖 |
Synteri(Fremont,CA) |
500~5000nt cDNA打印下于~4cm2玻璃片上 |
熒光 |
表達譜,新基因鑒定 |
German Cancer Instiute(Hedelberg,Germany) |
用f-moc或t-moc化學在片(原型PNA巨片)合成 |
熒光/質譜儀 |
表達譜/診斷 |
十 當前面臨的困難
盡管基因芯片技術已經取得了長足的發展,得到人們的矚目,但仍然存在著許多難以解決的問題,例如技術成本昂貴、復雜、檢測靈敏度較低,重復性差、分析泛圍較狹窄等問題。這些問題主要表現在樣品的制備、探針合成與固定、分子的標記、數據的讀取與分析等幾個方面。
1樣品制備上,當前多數公司在標記和測定前都要對樣品進行一定程度的擴增以便提高檢測的靈敏度,但仍不少人在嘗試繞過該問題,這包括Mosaic Technologies公司的固相PCR擴拉體系以及Lynx Therapeutics公司提出大量并行固相克隆方法,兩種方法各有優缺點,但目前尚未取得實際應用。
2 探針的合成與固定比較復雜,特別是對于制作高密度的探針陣列。使用光導聚合技術每步產率不高(95%),難于保證好的聚合效果。應運而生的其它很多方法,如壓電打壓、微量噴涂等多項技術,雖然技術難度較低方法也比較靈活,但存在的問題是難以形成高密度的探針陣列,所以只能在較小規模上使用。最近我國學者已成功地將分子印章技術應用探針的原位合成而且取得了比較滿意的結果。
3目標分子的標記也是一個重要的限速步驟,如何簡化或繞過這一步現在仍然是個問題。目標分子與探針的雜交會出現一些問題:首先,由于雜交位于固相表面,所以有一定程度的空間阻礙作用,有必要設法減少這種不利因素的影響。Southern曾通過向探針中引入間隔分子而使雜交效率提高于150倍。其次,探針分子的GC含量、長度以及濃度等都會對雜交產生一定的影響,因此需要分別進行分析和研究。
4信號的獲取與分析上,當前多數方法使用熒光法進行檢測和分析,重復性較好,但靈敏仍然不高。正在發展的方法有多種,如質譜法、化學發光法等。基因芯片上成千上萬的寡核苷酸探針由于序列本身有一定程度的重疊因而產生了大量的豐余信息。這一方面可以為樣品的檢測提供大量的難證機會,但同時,要對如此大量的信息進行解讀,目前仍是一個艱巨的技術問題。
5基因芯片的特異性還有待提高。最近Affymetrix公司生產的基因芯片采用瓣的技術,已大大提高檢測的特異性,估計在今后幾年內基因芯片的特異性將大大提高。
6如何檢測低豐度表達基因仍是目前一個重要問題。基因芯片要保證其特異性、但又要保證能檢測低豐度表達的基因,目前尚未解決這一問題。因為許多低豐度表達的基因,也可能表達出主要執行效應功能的蛋白質。因為基因表達與蛋白質生成并不成比例。
上述問題不僅是當前和今后一段時期內國內外基因芯片技術研究的焦點,同時也是基因芯片能否從實驗室研究推向臨床應用的關鍵問題。
十一 基因芯片技術的研究可能方向
縱觀當前基因芯片的研究趨勢,基因芯片在今后幾年內可能的發展方向,可能有以下幾個方面:
1.進一步提高探針陣列的集成度,如有多家公司的芯片陣列的集成度已達1.0×105左右,這樣基因數量在1.0×105以下的生物體(大多數生物體)的基因表達情況只用一塊芯片即可包括。
2 提高檢測的靈敏度和特異性。如檢測系統的優化組合和采用高靈敏度的熒光標志。多重檢測以提高特異性,減少假陽性。
4高自動化、方法趨于標準化、簡單化,成本降低。價格高昂是目前推廣應用的主要障礙之一,但隨著技術的革新,基因芯片的價格將會大大降低。
5高穩定性。寡核苷酸探針、RNA均不穩定,易受破壞。而肽核酸(PNA)有望取代普通RNA/DNA探針,可以確保探針的高穩定性。
6 研制新的應用芯片,如1999年美國環保局(EPA)組織專家研討會,討論了毒理學芯片的發展策略。近來多種新的生物芯片不斷問世,這是物理學、生物學與計算機科學共同的結晶。
7 研制芯片新檢測系統和分析軟件,以充分利用生物信息。
8 芯片技術將與其它技術結合使用,如基因芯片PCR、納米芯片等。
9不同生物芯片間綜合應用,如蛋白質芯片與基因芯片間相互作用等,可用于了解蛋白質與基因間相互作用的關系。
當前,基因芯片數量呈幾何級數在增長,功能也日益完善,但價格卻大大降低。可以預見,基因芯片可能在未來3-5年,也即到2005年左右,將在醫學和生物學領域中得到廣泛應用,甚至普及使用!到2010年它可能成為常規的實驗技術,正如個人電腦的迅速普及一樣。
基因芯片作為生物芯片的代表,其發展目標同生物芯片的目標一樣是“芯片實驗室”(Lab-on-chip),也即將整個生化檢測分析過程縮微到芯片上。“芯片實驗室”通過微細加工工藝制作的微濾器、微反應器、微泵、微閥門、微電極等以實現對生物樣品從制備、生化反應到檢測和分析的全過程,而且實驗過程趨于自動化從而極大地縮短的檢測和分析時間,節省了實驗材料,而且又降低人為主觀因素,大大提高實驗的客觀性。
總之,基因芯片技術發展到今天不過短短幾年時間,雖然還存在這樣或那樣的問題,但其在基因表達譜分析、基因診斷、藥物篩選及序列分析等諸多領域已呈現出廣闊的應用前景,隨著研究的不斷深入和技術的更加完善基因芯片一定會在生命科學研究領域發揮出其非凡的作用。基因芯片最終的意義和目的不再于本身,而在于它極大地提高了人類認識生命本質的能力和手段,為揭示人類這個復雜網絡系統打下基礎。從某種意義上我們可以這樣認為:基因的結構或種類決定物種;基因的功能或表達則決定生命,即生物的生、老、病、死。基因芯片技術將為我們提供一條認識生命本質的捷徑。當然基因芯片并非萬能,基因的表達并非代表生命活動本質,生命執行者應是蛋白質,因而基因芯片必需同蛋白組學相關技術,如二維凝膠電泳、蛋白質芯片、大規模雙雜交體系等相結合才有望真正揭示生命活動的時空過程。
參考文獻
1 Persidis Aris. Nature Biotechnol,1998;16:393
2 Andrew R et al.Nature Biotechnol,1998;16:520
3 Persidis Aris. Nature Biotechnol,1998;16:981
4 徐炳森,邵健忠.幾種新型生物芯片研究進展.生物化學與生物物理學進展,2000,27(3):251-254
5 McGall, G.H., Barone,A.D., Diggelmann,M., et al. J Am Chem Soc 1997;119(22): 5081-5050.
6 Pease AC, Solas D, Sullivan EJ, et al. Proc Natl Acad Sci USA,1994;91:5022-5026.
7 Beecher,Jody E.,McGall,Glenn H.,et al. Polym Mater Sci Eng, 1997;76:597-598.
8 Ramsay R. DNA chips: state-of-the art.Nature Biotechnology 1998;16:40-44.
9 Marshall A and Hodgson J. Nature Biotechnology 1998;16:2731.
10 Eggers M and Ehrlich D.Hematol Pathol,1995,9(1):1-159.
11 Yershov,K.,Barsky,V.,Belgovskiy,A.,et al.Proc Natl Acad Sci USA. 1996;93:4913-4918.
12 Parinov S,Barsky V,Yershov G,et al.Nucleic Acids Res,1996;24(15):2998-3004.
13 Yang HJ.Gene Logic’s Flow-thru ChipTM.人類基因組科學與生物醫藥發展研討會資料匯編。北京,1998,28-35.
14 David RW et al.Nature Biotechnol,1998;14:1681
15 Holstege FCP,Jennins EG,Wyrick JJ,et al.Dissecting the regulatory circuitry of a eukaryotic genome. Cell,1998,95:717~728.
16 Iyer VR, ,Eisen MB,Ross DT,et al.The transcriptional program in the response of human fibroblast to serum. Science,1999,283:83~87.
17 Carulli JP, Artinger M, Swain PM, et al. High throughput analysis of differential gene expression. J Cell Biochem Suppl, 1998;120(30-31):286-296
18 Rihn BH, Mohr S, McDowell SA, et al. Differential gene expression in mesothelioma.FEBS Lett, 2000, 480(2-3):95-100
19 Sgroi DC, Teng S, Robinson G, et al. In vivo gene expression profile analysis of human breast cancer progression. Cancer Res, 1999; 59(22):5656-5661
20 Moch H, Schraml P. Bubendorf L et al. High-throughput tissue microarray analgsis to evaluate genes uncorered by cDNA microarray screening in renal cell carcinoma. Am J Phathol, 1999;154(4):981-986
21 Loftus SK, Chen Y, Gooden G et al. Informatic selection of a neural crest-melanocyte cDNA set for microarray analysis. Proc Natl Acad Sci U S A, 1999; 96(16): 9277-9280
22 Schena M.,Shalon D.,Davis R.W.,et al.Quantitative monitoring of gene expression patterns with a complementary DNA microarray. Science, 1995;270:467-470.
23 Schena M, Shalon D, Heller R, et al. Parallel human genome analysis: microarray-based expression monitoring of 1000 genes[J]. Proc Natl Acad Sci USA, 1996, 93(20): 10614-10619.
24 Wallraff,G.,Labadie,J.,Brock,P.Chemtech 1997;22-32.
25 Southern EM.TIG,1996;12(3):110-115.
26 Dubiley S,Kirillov E,Lysov Y,et al.Nucleic Acids Res,1997;25(12);2259-2265.
27 Winzeler EA,Richards DR,Conway AR,et al.Direct allelic variation scanning of the yeast genome. Science,1998,281:1194~1197.
28 Hacia JG,Edgemon K,Sun B,et al.Two color hybridization analysis using high density oligonucleotide arrays and energy transfer dyes. Nucleic Acid Res,1998,26~16:3865~3866.
29 Hacia JG, Brody LC, Chee MS, et al. Detection of heterozygous mutation in BRCA1 using high density oligonucleotide arrays and two-color fluorescence analysis[J]. Nat Genet, 1996, 14(4): 441-447.
30 Cronin MT, Fucini RV, Kim SM, et al. Cystic fibrosis mutation by hybridization to light- generated DNA probe DNA arrays[J]. Hum Mut, 1996, 7(3): 244-255.
31 Guo Z,Guilfoyle FA,Thiel AJ,et al.Nucleic Acids Res,1994;22(24):5456-5465.
32 Drobyshev A,Mologina N,Shik V,et al.Gene,1997;188:45-52.
33 Lipshutz RJ,Morris D,Chee M, et al. BioFeature, 1995;19(3):442-447.
34 Chee M, Yang R, Hubbell E, et al. Accessing genetic information with high-density DNA arrays[J]. Science, 1996, 274(5287): 610-614.
35 Livache T,Fouque B,Roget A,et al. Polypyrrole DNA chip on a silicon device:Example of hepatitis C virus genotyping. Anal Biochem,1998,255:188~194.
36 Diamandis EP. Sequencing with microarray technology-A powerful new tool for molecular diagnostics.Clin Chem, 2000, 46(10):1523-1525
37 Ryu DD,Nam DH. Recent progress in biomolecular engineering. Biotechnol Prog, 2000;16(1):2-16
38 Dobrowolski SF, Banas RA, Naylor EW et al. DNA microarray technology for neonatal screening. Acta Paediatr Suppl, 1999; 88(432):61-64
39 Kozal MJ,Shah N,Shen N,et al.Extensive polymorphisms observed in HIV-I clade B protease gene using high-density oligonucleotide arrays. Natr Med,1996,2:753~759.
40 Marton MJ,DeRisi JL,Bennett HA,et al.Drug target validation and identification of secondary drug target effect using DNA microarray[J].Nature Medicine,1998,4:1293-1301.
41 Clarke PA, George M, Cunningham D, et al. Analysis of tumour gene expression following chemotherapeutics of patients with bowel cancer[J]. 1999, Nat Am Inc. http//:llgenetics.nature.com.
42 Nuwaysir EF, Bittner M, Trent J, et al. Microarrays and toxicology: the advent of toxicogenomics[J]. Mol Carcinog, 1999, 24(3): 153-159.
43 Andrew M et al.Nature Biotechnol,1998;16:27