異構信息集成與語義沖突消解策略的研究.pdf_第1頁
已閱讀1頁,還剩135頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著我國信息化建設的發(fā)展,各行各業(yè)建立起各種管理信息系統,基本實現了內部信息的高效管理。但是由于早期系統在建設時缺乏統一規(guī)劃和技術標準,使得這些系統中對數據的描述千差萬別,數據環(huán)境有很大差異。它們構成了一個巨大而復雜的異構數據環(huán)境,數據之間彼此分離,難以溝通,形成了無數的“信息孤島”。如何減少“信息孤島”,充分利用已有的信息資源,已經成為各行業(yè)信息化建設急需解決的共同問題。這需要應用信息集成技術對異構數據源進行科學有效的集成,屏蔽它們的

2、分布性和異構性,向用戶提供一致的數據界面和高效、簡便的信息服務。信息集成技術成為當今信息技術發(fā)展的趨勢之一。 由于大多數管理信息系統的數據都是結構化的存儲模式,因此異構數據庫集成是信息集成的基礎和前提。它涉及人工智能、高級數據庫與知識庫系統、分布式信息系統、等多個領域。 本文對信息集成系統的研究現狀和發(fā)展趨勢進行了深入的分析和探討,并圍繞異構數據庫信息集成,對異構數據庫復制技術、異構數據庫信息集成架構、以及異構數據庫信息

3、集成中的沖突發(fā)現和解決等問題展開研究。 首先綜合分析了信息集成技術的研究現狀和發(fā)展趨勢,對信息集成的兩種方法:物化方法和虛擬方法做了分析和比較,詳細說明了基于數據倉庫和基于Mediator/Wrapper的信息集成過程。其次針對信息集成全局數據模型物化方法,本文提出了應用異構數據庫復制技術構建全局數據模型,在各個子系統與全局數據模型間進行數據轉換的方法,提出一個“基于SQL重現法”的異構數據庫復制技術。然后針對信息集成過程中不可

4、避免的數據沖突問題進行研究,給出了基于本體的語義沖突解決算法。最后對研究工作進行了總結和展望。 論文在以下方面作了有益的探索和創(chuàng)新性工作。 (1)對異構數據庫復制技術進行深入分析,提出了一種基于“SQL重現法”的異構數據庫復制技術。該技術針對已有的異構數據庫復制技術在屏蔽異構性方面的缺陷,將日志法和觸發(fā)器法等多種復制方法相結合,并利用SQL語句記錄源端數據的凈變化,同時把產生該變化的SQL語句在目的端重現的方法,實現不同

5、數據庫間的數據復制。由于SQL的通用性,使之能夠成為異構數據庫的跨平臺復制工具。這里充分考慮了異構數據庫復制的平臺無關性,可以為用戶提供多快捷可靠的復制方法。 (2)從軟件工程的角度,提出一種基于異構數據庫復制技術的開放式信息集成架構。應用這種集成架構,能夠縮短信息集成系統的開發(fā)周期,提高運行效率。 (3)本文提出按照信息集成過程進行數據沖突分類的方法。把數據沖突分為概念集成時的語義沖突、模式集成時的模式沖突和實例集成時

6、的實例沖突。并對各種沖突進行詳細的分析研究,提出沖突的綜合解決策略。給出基于屬性空間的模式結構沖突解決算法,把模式結構沖突的解決轉換為可度量的矢量空間求解。同時針對語義沖突,本文應用本體技術,提出一個新的綜合語義相似度度量改進算法。 (4)把本文研究的成果應用到數字校園的信息集成建設實踐中。進行了原型系統CIS(CentralInformationSystem)的開發(fā)。通過把本文的研究成果在數字校園領域進行技術實現,以驗證本文研

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論