

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、人類(lèi)基因組計(jì)劃的實(shí)施,產(chǎn)生了大量的生物醫(yī)學(xué)數(shù)據(jù)。生物信息學(xué)是基于信息科學(xué)的理論和方法,利用計(jì)算機(jī)技術(shù),分析和研究生物醫(yī)學(xué)數(shù)據(jù)的新興學(xué)科?;诨虮磉_(dá)譜,在分子水平上對(duì)腫瘤進(jìn)行分析和研究,是當(dāng)前生物信息學(xué)研究的重要課題。本文應(yīng)用人工智能的方法,對(duì)腫瘤基因表達(dá)譜進(jìn)行了分析和研究,取得的研究成果主要有: 第一:提出了一種腫瘤基因表達(dá)數(shù)據(jù)殘缺值處理的方法。本文以GEO數(shù)據(jù)庫(kù)中的GSE4045系列結(jié)腸癌數(shù)據(jù)為研究對(duì)象。設(shè)定數(shù)據(jù)中樣本的殘缺
2、值個(gè)數(shù)閾值為α,去掉殘缺值個(gè)數(shù)大于α的樣本,殘缺值等于與殘缺值樣本類(lèi)別相同的同一基因的均值。對(duì)處理后的數(shù)據(jù)進(jìn)行聚類(lèi)分析,結(jié)果顯示出很好的聚類(lèi)有效性。 第二:本文建立了一種通過(guò)評(píng)價(jià)備選特征基因子集的分類(lèi)性能來(lái)確定腫瘤基因表達(dá)數(shù)據(jù)特征基因的方法,并基于胃癌基因表達(dá)譜提取了胃癌特征基因集合。首先應(yīng)用分類(lèi)信息指數(shù)、Relief、T檢驗(yàn)、秩和檢驗(yàn)算法,通過(guò)“腫瘤基因表達(dá)數(shù)據(jù)殘缺值的處理-數(shù)據(jù)標(biāo)準(zhǔn)化-搜索差異表達(dá)基因-去冗余分析”等步驟,提
3、取數(shù)據(jù)中的備選特征基因,再采用SVM分類(lèi)器評(píng)價(jià)備選特征基因子集對(duì)樣本的分類(lèi)正確率。分類(lèi)正確率最高,元素個(gè)數(shù)最多的備選特征基因子集即為特征基因。本文以Hippo.Y等提供的胃癌基因表達(dá)數(shù)據(jù)為研究對(duì)象,應(yīng)用本標(biāo)準(zhǔn)確定了特征基因提取的算法和可有效應(yīng)用于聚類(lèi)分析的特征基因。分析結(jié)果可視化程度好,可解釋性強(qiáng),具有很好的統(tǒng)計(jì)學(xué)和生物學(xué)意義。 第三:應(yīng)用邊介數(shù)聚類(lèi)算法提取了結(jié)腸癌基因網(wǎng)絡(luò)的模塊結(jié)構(gòu),并用模塊度函數(shù)對(duì)聚類(lèi)效果進(jìn)行了定性評(píng)價(jià)。邊介
4、數(shù)聚類(lèi)算法是一種基于圖論的算法,計(jì)算網(wǎng)絡(luò)中通過(guò)某條邊的最短路徑的條數(shù)即邊介數(shù),找出邊介數(shù)最大的邊并將其刪除,從而使網(wǎng)絡(luò)逐步聚成不同的子網(wǎng)絡(luò)。這些子網(wǎng)絡(luò)對(duì)應(yīng)生物網(wǎng)絡(luò)的功能模塊。本文首先對(duì)聚類(lèi)的有效性進(jìn)行了研究,利用模塊度函數(shù)比較了已知聚類(lèi)結(jié)果的Zachary空手道俱樂(lè)部網(wǎng)絡(luò)的邊介數(shù)聚類(lèi)和層次聚類(lèi)的結(jié)果,證明了邊介數(shù)聚類(lèi)算法的有效性,也解決了無(wú)監(jiān)督聚類(lèi)算法需要設(shè)定聚類(lèi)數(shù)的問(wèn)題。本文采用的邊介數(shù)聚類(lèi)算法借鑒了Girvan和Newman提出的社
5、區(qū)發(fā)現(xiàn)算法。利用邊介數(shù)聚類(lèi)算法對(duì)GSE4045系列結(jié)腸癌數(shù)據(jù)進(jìn)行了分析,通過(guò)檢索GO數(shù)據(jù)庫(kù)驗(yàn)證了邊介數(shù)聚類(lèi)所得基因模塊具有相似或相同的功能類(lèi),從而進(jìn)一步證明了算法的可行性和有效性。 本文的研究工作得到了國(guó)家自然科學(xué)基金(No.60234020)的支持,相關(guān)研究成果已被DCDIS國(guó)際期刊(SCI刊源)、WCCI2008(EI刊源)和中文核心期刊《北京工業(yè)大學(xué)學(xué)報(bào)》正式錄用。本文研究工作的意義在于通過(guò)發(fā)現(xiàn)相似性預(yù)測(cè)未知基因的功能,為
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于基因表達(dá)譜的腫瘤分類(lèi)特征基因選擇研究.pdf
- 基于基因表達(dá)譜數(shù)據(jù)的腫瘤分類(lèi)研究.pdf
- 基于基因表達(dá)譜的腫瘤數(shù)據(jù)分類(lèi)研究.pdf
- 基因表達(dá)譜的腫瘤特征基因提取研究分析
- 腫瘤基因表達(dá)譜分類(lèi)的特征基因選擇研究.pdf
- 基于基因表達(dá)譜的腫瘤放療敏感基因識(shí)別方法研究.pdf
- 基于腫瘤基因表達(dá)譜數(shù)據(jù)的分類(lèi)算法研究.pdf
- 腫瘤基因表達(dá)譜分類(lèi)方法研究.pdf
- 基于SVM和AdaBoost的腫瘤基因表達(dá)譜分類(lèi)研究.pdf
- 基于維數(shù)約簡(jiǎn)的腫瘤基因表達(dá)譜數(shù)據(jù)研究.pdf
- 基于稀疏性理論的腫瘤基因表達(dá)譜分類(lèi).pdf
- 腫瘤基因表達(dá)譜數(shù)據(jù)聚類(lèi)的譜方法研究.pdf
- 基于基因表達(dá)譜的基因挖掘算法研究.pdf
- 腫瘤表達(dá)譜基因芯片篩選膽囊癌腫瘤相關(guān)基因的研究.pdf
- 腫瘤基因表達(dá)譜數(shù)據(jù)特征選擇方法研究.pdf
- 基于腫瘤基因表達(dá)譜數(shù)據(jù)的特征提取方法.pdf
- 基于電路理論的腫瘤基因表達(dá)調(diào)控網(wǎng)絡(luò)的研究.pdf
- 基于基因表達(dá)譜的信息基因提取算法.pdf
- 基于Laplace譜的基因表達(dá)譜數(shù)據(jù)分類(lèi)研究.pdf
- 變應(yīng)性鼻炎基因表達(dá)譜及其相關(guān)基因研究.pdf
評(píng)論
0/150
提交評(píng)論