在生物信息學(xué)研究中,常用的方法和技術(shù)如下。
一、數(shù)學(xué)統(tǒng)計(jì)方法
數(shù)學(xué)統(tǒng)計(jì)在生物信息學(xué)中是一種最常用的方法。例如,在分析DNA語(yǔ)言中的語(yǔ)義、分析密碼子使用頻率、利用馬爾科夫模型進(jìn)行基因識(shí)別時(shí)都要用絞??臣品椒ā?BR>二、動(dòng)態(tài)規(guī)劃方法
動(dòng)態(tài)規(guī)劃(Dynamic Programming)是一種通用的優(yōu)化方法,其基本思想是:在狀態(tài)空間中,根據(jù)目標(biāo)函數(shù),通過(guò)遞推,求出一條從狀態(tài)起點(diǎn)到狀態(tài)終點(diǎn)的最優(yōu)路徑(代價(jià)最小的路徑)。動(dòng)態(tài)規(guī)劃在生物信息學(xué)研究中用得最多的方面是DNA序列或者蛋白質(zhì)序列的兩兩對(duì)比排列。
三、模式識(shí)別技術(shù)
模式識(shí)別是在輸入樣本中尋找特征并識(shí)別對(duì)象的一種技術(shù)。模式識(shí)別主要有兩種方法,一種是根據(jù)統(tǒng)計(jì)特征進(jìn)行識(shí)別,另一種是根據(jù)對(duì)象的結(jié)構(gòu)特征進(jìn)行識(shí)別,而后者常用的方法為句法識(shí)別。在基因識(shí)別中,對(duì)于DNA序列上的功能位點(diǎn)和特征信號(hào)的識(shí)別都需要用到模式識(shí)別。
四、數(shù)據(jù)庫(kù)技術(shù)
在生物信息學(xué)中,數(shù)據(jù)庫(kù)技術(shù)是最基本的技術(shù)。生物分子信息的存儲(chǔ)、管理、查詢(xún)等功能是建立在數(shù)據(jù)庫(kù)管理系統(tǒng)之上。目前的分子信息數(shù)據(jù)庫(kù)大都采用關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)。
五、人工神經(jīng)網(wǎng)絡(luò)技術(shù)
人工神經(jīng)網(wǎng)絡(luò)是對(duì)大腦神經(jīng)網(wǎng)絡(luò)的模擬,這種模擬既是在功能上的,也是在結(jié)構(gòu)上,這與傳統(tǒng)的串行計(jì)算機(jī)有著本質(zhì)的區(qū)別。神經(jīng)網(wǎng)絡(luò)計(jì)算不僅計(jì)算速度快,重要的是它更具有智能。從應(yīng)用來(lái)看,神經(jīng)網(wǎng)絡(luò)計(jì)算在優(yōu)化和模式識(shí)別方面具有非常強(qiáng)的能力。在生物信息學(xué)研究中,無(wú)論是基因識(shí)別還是蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè),神經(jīng)網(wǎng)絡(luò)都取得了比其它方法更為準(zhǔn)確的結(jié)果。
六、分子模型化技術(shù)
分子模型化是利用計(jì)算機(jī)分析分子結(jié)構(gòu)的一種技術(shù)。包括顯示分子的三維結(jié)構(gòu),顯示分子的理化或電子學(xué)特性,將分子小片段組裝成更大的分子片段或完整的分子結(jié)構(gòu)。利用分子模型化軟件,用戶(hù)可以通過(guò)交互操作平移、旋轉(zhuǎn)和縮放分子的三維結(jié)構(gòu),從不同的角度觀察分子構(gòu)象和形狀。對(duì)于DNA分子,我們可以直觀地觀察雙螺旋結(jié)構(gòu),看到兩條鏈的走向,還可以研究堿基之間的氫鍵配對(duì)。對(duì)于蛋白質(zhì)分子,既可以觀察其結(jié)構(gòu)骨架,可以觀察其外觀形狀,也可以研究其活性部位或結(jié)合部位的結(jié)構(gòu)。
七、分子力學(xué)和量子力學(xué)計(jì)算
在分子構(gòu)象優(yōu)化研究方面必須要用量子力學(xué)或分子力學(xué)。結(jié)構(gòu)優(yōu)化工作按理應(yīng)該用量子力學(xué)來(lái)完成,但是由于生物大分子體系太復(fù)雜,包含幾千個(gè)原子,超過(guò)了目前量子力學(xué)方法可以處理的體系范圍,所以研究生物大分子的構(gòu)象,主要還是用基于半經(jīng)驗(yàn)勢(shì)函數(shù)的分子力學(xué)方法,而量子力學(xué)則在確定勢(shì)函數(shù)的參數(shù)和研究局部性質(zhì)時(shí)起作用。
八、分子動(dòng)力學(xué)模擬
分子動(dòng)力學(xué)模擬是一種重要的統(tǒng)計(jì)物理方法,在物理和化學(xué)上早有應(yīng)用。用此方法可以研究蛋白質(zhì)的構(gòu)象,對(duì)蛋白質(zhì)進(jìn)行動(dòng)力學(xué)研究。這是利用計(jì)算機(jī)進(jìn)行模擬實(shí)驗(yàn)的基礎(chǔ)。
九、專(zhuān)家系統(tǒng)
專(zhuān)家系統(tǒng)將有關(guān)專(zhuān)家的知識(shí)和經(jīng)驗(yàn)以一定的知識(shí)表示形式(如產(chǎn)生式規(guī)則、語(yǔ)義網(wǎng)絡(luò)等)存放在計(jì)算中,并在用戶(hù)需要時(shí),以智能的方式幫助解決問(wèn)題,提供參考性決策。專(zhuān)家系統(tǒng)是人工智能領(lǐng)域里的一個(gè)重要分支,在生物信息學(xué)研究中也有著應(yīng)用,如用于基因識(shí)別。
十、Internet技術(shù)
目前,分子生物學(xué)研究人員進(jìn)行信息交流特別是生物分子數(shù)據(jù)的交流,都是通過(guò)Internet網(wǎng)實(shí)現(xiàn)的。在大多數(shù)情況下,你可以從Internet網(wǎng)上查到你所想要的生物分子數(shù)據(jù),如原始的序列和結(jié)構(gòu)數(shù)據(jù),經(jīng)過(guò)加工處理以后的數(shù)據(jù)。同時(shí),你也可以將所要處理的數(shù)據(jù)直接送到相應(yīng)的網(wǎng)絡(luò)服務(wù)器上,服務(wù)器接受你的處理請(qǐng)求,并將處理結(jié)果返回給你。
一、數(shù)學(xué)統(tǒng)計(jì)方法
數(shù)學(xué)統(tǒng)計(jì)在生物信息學(xué)中是一種最常用的方法。例如,在分析DNA語(yǔ)言中的語(yǔ)義、分析密碼子使用頻率、利用馬爾科夫模型進(jìn)行基因識(shí)別時(shí)都要用絞??臣品椒ā?BR>二、動(dòng)態(tài)規(guī)劃方法
動(dòng)態(tài)規(guī)劃(Dynamic Programming)是一種通用的優(yōu)化方法,其基本思想是:在狀態(tài)空間中,根據(jù)目標(biāo)函數(shù),通過(guò)遞推,求出一條從狀態(tài)起點(diǎn)到狀態(tài)終點(diǎn)的最優(yōu)路徑(代價(jià)最小的路徑)。動(dòng)態(tài)規(guī)劃在生物信息學(xué)研究中用得最多的方面是DNA序列或者蛋白質(zhì)序列的兩兩對(duì)比排列。
三、模式識(shí)別技術(shù)
模式識(shí)別是在輸入樣本中尋找特征并識(shí)別對(duì)象的一種技術(shù)。模式識(shí)別主要有兩種方法,一種是根據(jù)統(tǒng)計(jì)特征進(jìn)行識(shí)別,另一種是根據(jù)對(duì)象的結(jié)構(gòu)特征進(jìn)行識(shí)別,而后者常用的方法為句法識(shí)別。在基因識(shí)別中,對(duì)于DNA序列上的功能位點(diǎn)和特征信號(hào)的識(shí)別都需要用到模式識(shí)別。
四、數(shù)據(jù)庫(kù)技術(shù)
在生物信息學(xué)中,數(shù)據(jù)庫(kù)技術(shù)是最基本的技術(shù)。生物分子信息的存儲(chǔ)、管理、查詢(xún)等功能是建立在數(shù)據(jù)庫(kù)管理系統(tǒng)之上。目前的分子信息數(shù)據(jù)庫(kù)大都采用關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)。
五、人工神經(jīng)網(wǎng)絡(luò)技術(shù)
人工神經(jīng)網(wǎng)絡(luò)是對(duì)大腦神經(jīng)網(wǎng)絡(luò)的模擬,這種模擬既是在功能上的,也是在結(jié)構(gòu)上,這與傳統(tǒng)的串行計(jì)算機(jī)有著本質(zhì)的區(qū)別。神經(jīng)網(wǎng)絡(luò)計(jì)算不僅計(jì)算速度快,重要的是它更具有智能。從應(yīng)用來(lái)看,神經(jīng)網(wǎng)絡(luò)計(jì)算在優(yōu)化和模式識(shí)別方面具有非常強(qiáng)的能力。在生物信息學(xué)研究中,無(wú)論是基因識(shí)別還是蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè),神經(jīng)網(wǎng)絡(luò)都取得了比其它方法更為準(zhǔn)確的結(jié)果。
六、分子模型化技術(shù)
分子模型化是利用計(jì)算機(jī)分析分子結(jié)構(gòu)的一種技術(shù)。包括顯示分子的三維結(jié)構(gòu),顯示分子的理化或電子學(xué)特性,將分子小片段組裝成更大的分子片段或完整的分子結(jié)構(gòu)。利用分子模型化軟件,用戶(hù)可以通過(guò)交互操作平移、旋轉(zhuǎn)和縮放分子的三維結(jié)構(gòu),從不同的角度觀察分子構(gòu)象和形狀。對(duì)于DNA分子,我們可以直觀地觀察雙螺旋結(jié)構(gòu),看到兩條鏈的走向,還可以研究堿基之間的氫鍵配對(duì)。對(duì)于蛋白質(zhì)分子,既可以觀察其結(jié)構(gòu)骨架,可以觀察其外觀形狀,也可以研究其活性部位或結(jié)合部位的結(jié)構(gòu)。
七、分子力學(xué)和量子力學(xué)計(jì)算
在分子構(gòu)象優(yōu)化研究方面必須要用量子力學(xué)或分子力學(xué)。結(jié)構(gòu)優(yōu)化工作按理應(yīng)該用量子力學(xué)來(lái)完成,但是由于生物大分子體系太復(fù)雜,包含幾千個(gè)原子,超過(guò)了目前量子力學(xué)方法可以處理的體系范圍,所以研究生物大分子的構(gòu)象,主要還是用基于半經(jīng)驗(yàn)勢(shì)函數(shù)的分子力學(xué)方法,而量子力學(xué)則在確定勢(shì)函數(shù)的參數(shù)和研究局部性質(zhì)時(shí)起作用。
八、分子動(dòng)力學(xué)模擬
分子動(dòng)力學(xué)模擬是一種重要的統(tǒng)計(jì)物理方法,在物理和化學(xué)上早有應(yīng)用。用此方法可以研究蛋白質(zhì)的構(gòu)象,對(duì)蛋白質(zhì)進(jìn)行動(dòng)力學(xué)研究。這是利用計(jì)算機(jī)進(jìn)行模擬實(shí)驗(yàn)的基礎(chǔ)。
九、專(zhuān)家系統(tǒng)
專(zhuān)家系統(tǒng)將有關(guān)專(zhuān)家的知識(shí)和經(jīng)驗(yàn)以一定的知識(shí)表示形式(如產(chǎn)生式規(guī)則、語(yǔ)義網(wǎng)絡(luò)等)存放在計(jì)算中,并在用戶(hù)需要時(shí),以智能的方式幫助解決問(wèn)題,提供參考性決策。專(zhuān)家系統(tǒng)是人工智能領(lǐng)域里的一個(gè)重要分支,在生物信息學(xué)研究中也有著應(yīng)用,如用于基因識(shí)別。
十、Internet技術(shù)
目前,分子生物學(xué)研究人員進(jìn)行信息交流特別是生物分子數(shù)據(jù)的交流,都是通過(guò)Internet網(wǎng)實(shí)現(xiàn)的。在大多數(shù)情況下,你可以從Internet網(wǎng)上查到你所想要的生物分子數(shù)據(jù),如原始的序列和結(jié)構(gòu)數(shù)據(jù),經(jīng)過(guò)加工處理以后的數(shù)據(jù)。同時(shí),你也可以將所要處理的數(shù)據(jù)直接送到相應(yīng)的網(wǎng)絡(luò)服務(wù)器上,服務(wù)器接受你的處理請(qǐng)求,并將處理結(jié)果返回給你。