社會基礎數(shù)據分析挖掘系統(tǒng)關鍵技術的研究與實現(xiàn).pdf_第1頁
已閱讀1頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數(shù)據挖掘是解決海量數(shù)據模式識別的重要途徑,數(shù)據挖掘本身就是面向應用的技術,當前信息社會各行各業(yè)的決策者們對于隱藏于海量數(shù)據中的信息前所未有的渴求,這兩者的結合越來越普遍,帶來的效益越來越明顯??v觀國內外數(shù)據挖掘技術在國家與公共安全領域的應用并不多,產生實際結果并且能推動相關工作開展的研究比較有限。本文提出了“松散關系”方法并與關聯(lián)規(guī)則挖掘結合起來,設計實現(xiàn)了基礎數(shù)據關聯(lián)規(guī)則挖掘系統(tǒng),將實際工作需求與數(shù)據挖掘技術結合起來,在海量基礎數(shù)據中

2、進行了探索,為能夠利用挖掘來解決實際業(yè)務問題進行了有效嘗試,在本行業(yè)內社會基礎數(shù)據深層利用的理論與實踐方面都具有十分重要的意義。
  本文根據調查工作實際需求,提出了利用定義“松散關系”來度量基礎數(shù)據間的關系的方法,設定了具有異常特點的閾值,進一步闡述了“松散關系”與業(yè)務工作的關系,提出了運用關聯(lián)規(guī)則方法挖掘隱含在基礎數(shù)據中的具有松散關系性質的人群。
  設計并實現(xiàn)了基礎數(shù)據關聯(lián)規(guī)則挖掘系統(tǒng),該系統(tǒng)主要分為三個模塊:數(shù)據抽取

3、和預處理模塊、關聯(lián)規(guī)則挖掘模塊和松散關系判定模塊。數(shù)據抽取和預處理模塊的功能主要是提取和轉換挖掘任務需要的數(shù)據;關聯(lián)規(guī)則挖掘模塊完成對數(shù)據的挖掘并對結果進行一定的組織;業(yè)務用戶通過判定模塊對挖掘結果的有效性及可用性進行判定。
  基礎數(shù)據種類龐雜,數(shù)量巨大,針對具體業(yè)務問題的挖掘效率面臨著嚴峻考驗。本文根據挖掘任務特點,對Apriori挖掘方法進行了一定改進,直接在每條事務內進行自連接,形成候選項集,有效減少了無效候選項集的生成,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論