腫瘤Biomarker的計(jì)算系統(tǒng)生物學(xué)研究及生物網(wǎng)絡(luò)可視化軟件的開(kāi)發(fā).pdf_第1頁(yè)
已閱讀1頁(yè),還剩165頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、背景和目的
   近年來(lái),大規(guī)模的生物分子相互作用數(shù)據(jù),特別是利用高通量手段研究并整理的蛋白質(zhì)相互作用(Protein-protein interaction,PPI)數(shù)據(jù)庫(kù)和海量數(shù)據(jù)的發(fā)布,對(duì)于疾病,特別是腫瘤的研究著眼于在病理狀態(tài)下整個(gè)分子系統(tǒng)網(wǎng)絡(luò)的動(dòng)態(tài)變化;同時(shí),開(kāi)始從系統(tǒng)、全局的角度出發(fā),研究疾病臨床綜合癥群和內(nèi)在的生物分子網(wǎng)絡(luò)之間的關(guān)系,進(jìn)一步改進(jìn)疾病的分類標(biāo)準(zhǔn),重新對(duì)疾病進(jìn)行更準(zhǔn)確的定義。
   腫瘤蛋白分子

2、標(biāo)記(Protein Biomarker)的應(yīng)用對(duì)腫瘤的診斷、預(yù)后和靶向治療有重要的作用;也為疾病的分類提供了有效依據(jù)。然而,由于腫瘤發(fā)生和發(fā)展過(guò)程中復(fù)雜病理機(jī)制,腫瘤Biomarker發(fā)掘的過(guò)程非常艱巨;到目前為止,只有9個(gè)腫瘤相關(guān)蛋白通過(guò)FDA認(rèn)證,作為臨床檢測(cè)Biomarker用于癌癥的診斷檢測(cè)。在系統(tǒng)生物學(xué)蓬勃發(fā)展的背景下,作為候選的Biomarker應(yīng)該從系統(tǒng)水平上進(jìn)行研究,需要大規(guī)模收集數(shù)據(jù),探討腫瘤發(fā)生過(guò)程中關(guān)鍵的致病基因

3、和其下游的效應(yīng)基因,選擇有效的診斷和治療Biomarker,盡量避免Biomarker選擇中高假陽(yáng)性和假陰性等一系列問(wèn)題。
   本課題,我們從系統(tǒng)生物學(xué)角度,探討了腫瘤蛋白Biomarker發(fā)掘的一系列問(wèn)題。1)首次,從人類分子相互作用網(wǎng)絡(luò)、基因組、蛋白質(zhì)組學(xué),以及癌癥的疾病臨床綜合癥群的宏觀角度,分析1000多個(gè)經(jīng)驗(yàn)型腫瘤蛋白Biomarker的性質(zhì),為腫瘤蛋白Biomarker發(fā)掘計(jì)算模型的構(gòu)建,提供了生物學(xué)依據(jù);2)探討

4、腫瘤蛋白Biomarker發(fā)掘的算法,利用人類全局PPI網(wǎng)絡(luò)的信息和疾病表型關(guān)聯(lián)網(wǎng)絡(luò)的信息,進(jìn)行模型構(gòu)建,較傳統(tǒng)的有效的計(jì)算方法,效率進(jìn)一步提高;3)以原發(fā)性肝細(xì)胞癌(HCC)和其重要的蛋白Biomarker-甲胎蛋白(AFP)為例,深入探討AFP在HCC發(fā)生和發(fā)展中的關(guān)系,比較AFP陽(yáng)性、陰性HCC臨床樣本中基因表達(dá)差異并推斷了相關(guān)的分子機(jī)制;4)設(shè)計(jì)和研發(fā)面向多級(jí)(Muti-scale)生物網(wǎng)絡(luò)的可視化數(shù)據(jù)發(fā)掘工具--ProteoL

5、ens,通過(guò)兼容SQL語(yǔ)句,改進(jìn)了傳統(tǒng)可視化工具的兼容性差,不能方便、有效的處理多樣的系統(tǒng)生物學(xué)數(shù)據(jù)的弱點(diǎn);能夠更加有效的建立包含豐富注解信息的和多級(jí)生物學(xué)網(wǎng)絡(luò),來(lái)理解復(fù)雜的生物學(xué)網(wǎng)絡(luò)的結(jié)構(gòu),從中挖掘有效的信息。我們的研究,旨在溝通生物學(xué)基礎(chǔ)研究和臨床醫(yī)學(xué)研究;并構(gòu)架計(jì)算分析的平臺(tái),使計(jì)算生物學(xué)家也能夠有效的參與腫瘤的診斷和治療這一重大問(wèn)題中來(lái)。主要研究方法
   1、數(shù)據(jù)的收集和整理
   1)疾病基因,癌癥基因,腫瘤

6、蛋白Biomarker,必要基因,藥物靶分子基因;
   2)PPI網(wǎng)絡(luò),TF-基因調(diào)節(jié)網(wǎng)絡(luò),Pathway,基因共表達(dá)網(wǎng)絡(luò);
   3)組織特異性數(shù)據(jù),組織表達(dá)數(shù)據(jù),Gene Ontology數(shù)據(jù),健康人血漿蛋白肽的圖譜數(shù)據(jù);
   4)分子ID映射,疾病術(shù)語(yǔ),分子注解信息;
   2、腫瘤蛋白Biomarker的性質(zhì)分析
   1)PPI網(wǎng)絡(luò)中拓?fù)湫再|(zhì)比較;
   2)組織特異性比較;

7、
   3)表達(dá)范圍比較;
   4)Gene Ontology關(guān)鍵詞比較;
   5)Co-Pathway統(tǒng)計(jì);
   6)共表達(dá)統(tǒng)計(jì);
   3、癌癥表型特異性分子網(wǎng)絡(luò)的構(gòu)建
   1)PPI網(wǎng)絡(luò)子網(wǎng);
   2)TF-基因調(diào)節(jié)子網(wǎng);
   4、腫瘤表型關(guān)聯(lián)網(wǎng)絡(luò)的定義與比較
   1)腫瘤疾病基因定義的疾病表型關(guān)聯(lián)網(wǎng)絡(luò);
   2)腫瘤蛋白Biomark

8、er定義的疾病表型關(guān)聯(lián)網(wǎng)絡(luò);
   3)GWAS疾病相關(guān)位點(diǎn)定義的疾病表型關(guān)聯(lián)網(wǎng)絡(luò);
   4)網(wǎng)絡(luò)間通過(guò)構(gòu)建相似性得分和鄰接矩陣聚類進(jìn)行比較;
   5、SW-RWR算法設(shè)計(jì)和評(píng)估
   1)覆蓋率:
   2)敏感性;
   3)準(zhǔn)確度;
   6、AFP分子演化的分析
   1)進(jìn)化樹(shù)構(gòu)建;
   2)結(jié)構(gòu)域分析;
   3)基因調(diào)節(jié)區(qū)序列分析;

9、>   7、AFP+/-原發(fā)性肝細(xì)胞癌臨床樣本的基因表達(dá)差異分析
   1)肝細(xì)胞癌表達(dá)譜數(shù)據(jù)收集與整理;
   2)Meta-analysis;
   3)貝葉斯網(wǎng)絡(luò)和PPI網(wǎng)絡(luò)比較;
   4)基因功能分析;
   8、網(wǎng)絡(luò)可視化軟件ProteoLens的設(shè)計(jì)和實(shí)現(xiàn)
   1)基礎(chǔ)框架;
   2)Java編程實(shí)現(xiàn);
   3)系統(tǒng)生物學(xué)研究示例。
   研究

10、結(jié)果
   第一部分
   腫瘤蛋白Biomarker的性質(zhì)分析
   為評(píng)估腫瘤蛋白Biomarker的特性,我們選擇疾病基因、癌癥基因、藥物靶蛋白和必要基因作為參照。
   1)各個(gè)功能集合之間的重疊的基因數(shù)目較少;
   2)腫瘤Biomarker在PPI網(wǎng)絡(luò)中的節(jié)點(diǎn)的平均度數(shù)小于癌癥基因和必要基因在PPI網(wǎng)絡(luò)中節(jié)點(diǎn)的平均度數(shù),但高于疾病基因和藥物靶蛋白的平均數(shù);
   3)腫瘤蛋白

11、Biomarker包含較多的組織特異性基因;
   4)腫瘤蛋白Biomarker中基因平均表達(dá)的組織數(shù)目甚至多于必要基因集合中的平均水平;
   5)腫瘤蛋白Biomarker集中共有385個(gè)顯著的GO術(shù)語(yǔ),包括26個(gè)細(xì)胞模塊術(shù)語(yǔ),0個(gè)分子功能術(shù)語(yǔ)和359個(gè)生物過(guò)程術(shù)語(yǔ);
   6)腫瘤蛋白Biomarker在以疾病基因?yàn)榉N子擴(kuò)張的PPI和PPI-TF-調(diào)節(jié)基因網(wǎng)絡(luò)中的分布:當(dāng)選擇更加精確的的種子蛋白(接近癌癥

12、基因的時(shí)候)進(jìn)行PPI和PPI-TF-調(diào)節(jié)基因網(wǎng)絡(luò)構(gòu)建,與腫瘤蛋白Biomarker的交集占總腫瘤蛋白Biomarker集的比率顯著增大;
   7)腫瘤蛋白Biomarker和相應(yīng)表型的疾病基因易于共表達(dá)并參與同一Pathway。
   構(gòu)建基于腫瘤蛋白Biomarker疾病表型網(wǎng)絡(luò)(DBN)
   762個(gè)腫瘤蛋白Biomarker對(duì)應(yīng)于59類不同的癌癥表型中,包含820個(gè)“Biomarker-疾病表型”關(guān)聯(lián)

13、,平均兩個(gè)癌癥表型有8個(gè)相同的Biomarer;每個(gè)Biomarker出現(xiàn)在13個(gè)癌癥表型中。所有59個(gè)結(jié)點(diǎn),連接成一個(gè)聯(lián)通圖,沒(méi)有孤立結(jié)點(diǎn)或子網(wǎng)。
   比較DBN和基于疾病基因的疾病表型網(wǎng)絡(luò)(DAN)
   疾病基因和蛋白Biomarker描述的腫瘤表型之間關(guān)系具有等效性。
   第二部分
   SW-RWR算法
   是在隨機(jī)行走算法(Random Walks Ranking,RWR)的基礎(chǔ)

14、上,利用腫瘤表型關(guān)聯(lián)網(wǎng)絡(luò)的先驗(yàn)知識(shí),指導(dǎo)PPI網(wǎng)絡(luò)中隨機(jī)行走策略。SW-RWR是為解決腫瘤蛋白Biomarker發(fā)掘的問(wèn)題對(duì)RWR算法的改進(jìn)。
   SW-RWR算法對(duì)白血病蛋白Biomarker的排序
   1)從基于腫瘤Biomarker的表型關(guān)聯(lián)網(wǎng)絡(luò)中,依據(jù)相似性得分提取白血病相關(guān)的疾病表型;
   2)分析白血病與選擇的表型之間的相關(guān)性:與白血病相關(guān)聯(lián)的這5個(gè)癌癥表型,其疾病基因與白血病疾病基因之間通過(guò)蛋

15、白質(zhì)相互作用緊密關(guān)聯(lián);
   3)SW-RWR選擇的20個(gè)蛋白的生物學(xué)意義分析,顯示出與白血病分子機(jī)制的強(qiáng)相關(guān)性;
   4)通過(guò)敏感性和準(zhǔn)確率(使用陽(yáng)性預(yù)測(cè)值,PPV)評(píng)估對(duì)白血病蛋白Biomarker的預(yù)測(cè)效力:SW-RWR優(yōu)于ZRWR。
   SW-RWR算法對(duì)肺癌蛋白Biomarker的排序
   1)建立基于GWAS的疾病表型關(guān)聯(lián)網(wǎng)絡(luò):分別創(chuàng)建了3個(gè)疾病相關(guān)網(wǎng)絡(luò)(DAN),網(wǎng)絡(luò)結(jié)點(diǎn)為疾病表型,網(wǎng)

16、絡(luò)關(guān)聯(lián)分別定義為:疾病表型之間有相同的SNP位點(diǎn)(DAS)-DAN1,相同的DAS對(duì)應(yīng)基因-DAN2,或相同的DAs對(duì)應(yīng)的染色體區(qū)域-DAN3。共包含85個(gè)不同的節(jié)點(diǎn),代表85個(gè)獨(dú)立疾病表型。
   2)DAN中抽取與肺癌關(guān)聯(lián)的子網(wǎng):確定5個(gè)肺癌相關(guān)的疾病表型,這5個(gè)疾病和肺癌在遺傳學(xué)上有相同的異?;?;這些疾病基因之間通過(guò)直接或間接地PPI相互連接,表示了疾病之間的分子機(jī)制的內(nèi)在關(guān)聯(lián);同時(shí),在病理研究上,這5個(gè)疾病也有與肺癌關(guān)

17、聯(lián)緊密的證據(jù)。
   3)SW-RWR選擇的20個(gè)蛋白的生物學(xué)意義分析;
   4)通過(guò)敏感性和準(zhǔn)確率評(píng)估對(duì)肺癌蛋白Biomarker的預(yù)測(cè)效力:SW-RWR優(yōu)于RWR。
   第三部分
   AFP以及類自蛋白家族分子演化分析
   1)進(jìn)化樹(shù)顯示,蛋白的進(jìn)化與物種的進(jìn)化是一致的,就AFP分支來(lái)看,雞較人、狗、大鼠、小鼠同源性較低,而更相似于其旁系同源物--雞ALB;大鼠與小鼠之間AFP同源性較

18、高,人與狗之間AFP同源性較高。類白蛋白家族成員,在魚(yú)類只存在一個(gè),兩棲類有兩個(gè),鳥(niǎo)類有三個(gè),哺乳類有四個(gè)。
   2)結(jié)構(gòu)域分析。在七鰓鰻中發(fā)現(xiàn)了具有多個(gè)結(jié)構(gòu)域的白蛋白,由此可以推測(cè),在原索動(dòng)物或無(wú)脊椎動(dòng)物中存在單個(gè)的類似白蛋白結(jié)構(gòu)域的蛋白。來(lái)自于同一個(gè)蛋白的不同白蛋白結(jié)構(gòu)域之間較與其直系同源蛋白對(duì)應(yīng)的白蛋白結(jié)構(gòu)域差別較大,可以推測(cè),基因復(fù)制事件是以蛋白為單位的。類白蛋白家族成員,第一和第二結(jié)構(gòu)域較第三結(jié)構(gòu)域更為相似,可推斷最

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論