国产激情久久久久影院小草_国产91高跟丝袜_99精品视频99_三级真人片在线观看

基于時(shí)間序列理論方法的生物序列特征分析

時(shí)間:2024-10-27 09:21:53 論文提綱 我要投稿

基于時(shí)間序列理論方法的生物序列特征分析

    論文簡介:生物信息學(xué)的主要研究對(duì)象是DNA、RNA和蛋白質(zhì)分子,因?yàn)檫@些生物大分子包含了遺傳及物種進(jìn)化的所有信息,隨著DNA和蛋白質(zhì)被測(cè)序,如何從這些DNA和蛋白質(zhì)序列中獲得更多的生物信息是具有挑戰(zhàn)性的問題.隨著堿基和氨基酸在基因數(shù)據(jù)庫中的規(guī)模呈指數(shù)增長,利用新的理論方法去研究DNA和蛋白質(zhì)序列就變得越來越重要.許多生物學(xué)家、物理學(xué)家、數(shù)學(xué)家和計(jì)算機(jī)專家都被吸引到這個(gè)研究領(lǐng)域中來。 @@ 在介紹了生物信息學(xué)的研究背景之后,本文首先介紹了研究生物序列特性的時(shí)間序列理論方法,對(duì)本文要用到的短記憶ARMA模型和長記憶ARFIMA模型作了詳細(xì)的闡述,為研究DNA序列、蛋白質(zhì)序列特性做了理論上的準(zhǔn)備工作。 @@ 混沌游走表示(Chaos Game Representation,簡記為CGR)是一種迭代映射技術(shù),它可以把序列中的每一個(gè)單元,如DNA序列中的核苷酸,蛋白質(zhì)序列中的氨基酸,映射到一個(gè)連續(xù)的坐標(biāo)空間中去.我們基于CGR坐標(biāo)提出了一種將DNA序列轉(zhuǎn)換成一個(gè)時(shí)間序列(CGR-游走序列)的方法,并引入長記憶ARFIMA(p,d,q)模型來分析,我們分析了十條DNA序列的CGR-游走序列,發(fā)現(xiàn)都能用長記憶ARFIMA(p,d,q)模型高度顯著地?cái)M合.作為一個(gè)具有完善算法的經(jīng)典時(shí)間序列模型,ARFIMA模型能幫助我們挖掘DNA序列中未知的特性, @@ 因?yàn)楹线m的ARFIMA模型在模型選擇時(shí)成功率較低,且在參數(shù)估計(jì)中最大似然計(jì)算量較大,用短記憶模型去近似長記憶模型是研究者們感興趣的問題,我們考慮利用短記憶ARMA(1,1)過程去近似長記憶ARFIMA(p,d,q)過程,證明了這種適應(yīng)性方法的均方誤差準(zhǔn)則,并引入DNA序列的十條CGR-游走序列用以分析,驗(yàn)證了這種近似方法的有效性,為長記憶DNA序列找到了一個(gè)算法更為簡單的近似模型。 @@ 在此基礎(chǔ)上,我們還考慮利用ARMA(2,2)模型去逼近ARFIMA(O,d,O)模型,基于ARMA(2,2)模型和ARMA(1,1)模型有效性損失率的比較可知,ARMA(2,2)近似模型優(yōu)于ARMA(1,1)近似模型.為驗(yàn)證此結(jié)論,還引入了服從ARFIMA(O,d O)模型的CGR-游走序列用以分析,比較了ARMA(1,1)和ARMA(2,2)這兩個(gè)模型近似ARFIMA(O,d,O)模型的有效性,根據(jù)殘差標(biāo)準(zhǔn)差的結(jié)果可得ARMA(2,2)近似模型優(yōu)于ARMA(1,1)近似模型, @@ 我們修改了Kalman濾波遞推公式,解決了長記憶ARFIMA模型的缺失數(shù)據(jù)問題,并利用DNA序列的CGR-游走序列驗(yàn)證了此方法的有效性, @@ 基于已建立的DNA序列的CGR-游走模型,我們建立了一個(gè)類似的基于詳細(xì)HP模型的連接蛋白質(zhì)序列的CGR-游走模型,并引入長記憶ARFIMA(p,d,q)模型來分析,發(fā)現(xiàn)來自12條細(xì)菌全基因組的連接蛋白質(zhì)序列的CGR-游走序列能用長記憶ARFIMA(p,d,q)模型顯著地?cái)M合。 @@關(guān)鍵詞:混沌游走表示(CGR)-游走模型;DNA序列;蛋白質(zhì)序列;短記憶ARMA模型;長記憶ARFIMA模型;均方誤差準(zhǔn)則;最大似然估計(jì):狀態(tài)空間模型

基于時(shí)間序列理論方法的生物序列特征分析

請(qǐng)繼續(xù)閱讀相關(guān)推薦:畢業(yè)論文    應(yīng)屆生求職

畢業(yè)論文范文查看下載      查看的論文開題報(bào)告     查閱參考論文提綱

閱更多的畢業(yè)論文致謝    相關(guān)畢業(yè)論文格式       查閱更多論文答辯

 

【基于時(shí)間序列理論方法的生物序列特征分析】相關(guān)文章:

SAS統(tǒng)計(jì)軟件在《時(shí)間序列分析》課程中輔助教論文03-08

時(shí)間序列數(shù)據(jù)挖掘研究論文提綱03-27

SAS統(tǒng)計(jì)軟件在《時(shí)間序列分析》課程中輔助教學(xué)的探討11-25

蛋白質(zhì)序列的并行分類方法研究論文提綱11-20

基于Copula理論的股市風(fēng)險(xiǎn)分析提綱12-02

基于鏈接結(jié)構(gòu)理論的句群結(jié)構(gòu)類型的分析11-28

淺論新媒體視覺傳達(dá)的特征理論分析12-06

基于模糊灰色理論紡織廠火災(zāi)風(fēng)險(xiǎn)分析12-06

基于激勵(lì)理論模式下的ERP團(tuán)隊(duì)激勵(lì)方法探討11-25

  • 相關(guān)推薦