

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、伴隨著海量數(shù)據(jù)的不斷涌現(xiàn),“數(shù)據(jù)充沛,卻信息匱乏”的矛盾日益突出。數(shù)據(jù)挖掘?yàn)槲覀儚暮A繑?shù)據(jù)中提取或挖掘有用信息提供了有效的技術(shù)手段,其中作為數(shù)據(jù)挖掘重要方法的決策樹(shù)分類挖掘被廣泛應(yīng)用和研究。作為決策樹(shù)分類中的經(jīng)典算法,ID3算法是Quinlan在1986年提出的,其選擇具有最大信息增益值的屬性作為分裂屬性,從而使分裂后的系統(tǒng)具有的信息熵最小,并使所構(gòu)造決策樹(shù)的結(jié)構(gòu)更簡(jiǎn)單,進(jìn)而提高分類算法的運(yùn)行效率和分類準(zhǔn)確率。
針對(duì)ID3算法
2、在用信息增益作為分裂屬性選擇的標(biāo)準(zhǔn)時(shí)存在多值偏向的問(wèn)題,即偏向于取值較多的屬性,本文提出了一種基于影響因子的ID3改進(jìn)算法。該算法通過(guò)引入影響因子的概念,在計(jì)算信息增益時(shí)考慮屬性及其屬性值對(duì)類標(biāo)記的影響因子,選擇改進(jìn)后的信息增益作為劃分屬性的選擇標(biāo)準(zhǔn)。由于取值較多的屬性的影響因子在較高概率上取值較小,從而在一定程度上克服了ID3算法的多值偏向問(wèn)題。同時(shí),為了減小訓(xùn)練數(shù)據(jù)集中噪聲或離群點(diǎn)對(duì)決策樹(shù)構(gòu)造過(guò)程的影響,改進(jìn)后的算法通過(guò)引入誤分類比
最新文檔
- 一種改進(jìn)的ID3決策樹(shù)算法研究.pdf
- 數(shù)據(jù)挖掘中一種基于遺傳算法改進(jìn)的ID3算法.pdf
- 基于ID3決策樹(shù)算法的改進(jìn)研究.pdf
- 基于決策樹(shù)ID3算法的改進(jìn)研究.pdf
- 基于決策樹(shù)的ID3算法的研究與改進(jìn).pdf
- 決策樹(shù)ID3算法的研究和改進(jìn).pdf
- 一種集合劃分上的融合算子及其在ID3算法中的應(yīng)用.pdf
- 決策樹(shù)ID3算法的改進(jìn)和應(yīng)用研究.pdf
- 機(jī)器學(xué)習(xí)決策樹(shù)算法id3
- 康萊特對(duì)肺癌分化抑制因子1(Id1)、分化抑制因子3(Id3)表達(dá)影響的研究.pdf
- 基于ID3算法的智能代理決策系統(tǒng)設(shè)計(jì)與研究.pdf
- 基于權(quán)重的一種Apriori改進(jìn)算法.pdf
- 集合劃分上的模糊積分與ID3算法.pdf
- 一種基于Browes Rank+的改進(jìn)算法.pdf
- 一種改進(jìn)的CELP算法.pdf
- 一種Rete算法的改進(jìn)方法.pdf
- 一種改進(jìn)的AODV路由算法.pdf
- 一種改進(jìn)的COBWEB算法研究.pdf
- 一種改進(jìn)的誤差擴(kuò)散算法.pdf
- 面向CRM的ID3決策樹(shù)分類算法及其應(yīng)用.pdf
評(píng)論
0/150
提交評(píng)論