

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、隨著互聯(lián)網(wǎng)和萬維網(wǎng)(World Wide Web)的快速繁榮發(fā)展,萬維網(wǎng)逐漸成為人們生活中不可或缺的一種信息獲取來源。萬維網(wǎng)給信息檢索技術帶來了極大的機遇和挑戰(zhàn)。經(jīng)過最近十幾年的發(fā)展,信息檢索已經(jīng)由一個純粹的學術研究學科轉(zhuǎn)變成大多數(shù)人信息獲取的技術基礎。
隨著Web2.0概念的普及和發(fā)展,萬維網(wǎng)不再僅僅是一個巨大的信息庫,更逐漸成為一個用戶參與和交流的平臺。Web2.0應用網(wǎng)站的蓬勃發(fā)展將再次推動信息檢索技術的革新。本文認
2、為,在Web2.0時代,信息檢索技術主要有以下三方面的發(fā)展趨勢:1)更加靈活的個性化信息服務。隨著用戶的急劇增加,Web2.0網(wǎng)站迫切需要滿足用戶的個性化信息需求。然而,傳統(tǒng)的Web信息檢索技術并不擅長處理Web2.0應用的復雜結(jié)構(gòu)數(shù)據(jù)。Web2.0需要更加靈活的個性化信息服務,如信息推薦系統(tǒng)。2)更加有效的多媒體數(shù)據(jù)檢索技術。隨著Web2.0的普及,用戶可以很方便地上傳和分享多媒體信息。多媒體數(shù)據(jù)的迅速增多使得多媒體信息檢索技術成為人
3、們關注的焦點。3)檢索服務的專業(yè)化。當前,Web2.0應用中的用戶產(chǎn)生數(shù)據(jù)已經(jīng)成為萬維網(wǎng)這個巨大信息庫的重要組成部分之一。過于繁雜的Web數(shù)據(jù)使得Web信息檢索向領域化、專業(yè)化方向發(fā)展。
很多Web數(shù)據(jù)呈現(xiàn)復雜的內(nèi)在關聯(lián)結(jié)構(gòu)。本文指出,為了更好地解決這些數(shù)據(jù)上的相關檢索問題、提升檢索效果,就需要充分利用蘊含在數(shù)據(jù)復雜關聯(lián)結(jié)構(gòu)中的知識。圖學習技術能夠?qū)碗s關聯(lián)結(jié)構(gòu)進行較好地建模并捕捉其中蘊含的知識。因此,結(jié)合上述發(fā)展趨勢,本
4、文研究工作圍繞基于圖學習的Web信息檢索技術展開,具體在以下四個相關研究問題上進行深入研究并提出了新穎的圖學習算法:
1)Web2.0社區(qū)化標簽應用中的個性化標簽推薦:社區(qū)化標簽應用中用戶可以對資源任意地加標簽。產(chǎn)生的標簽標注數(shù)據(jù)可以很自然地用圖來建模。本文提出一種新的基于圖的多類關聯(lián)對象查詢排序算法,以解決社區(qū)化標簽應用中的個性化標簽推薦問題。
2)Web2.0社區(qū)化標簽應用中的個性化文檔推薦;傳統(tǒng)的信息推
5、薦系統(tǒng)聚焦在評級打分數(shù)據(jù)上,而社區(qū)化標簽應用中的標簽標注數(shù)據(jù)是一種不同的且具有特殊圖結(jié)構(gòu)的數(shù)據(jù)。本文提出一種新的基于圖的多類關聯(lián)對象降維(語義空間學習)算法,將用戶、標簽和文檔映射到同一語義空間中,然后根據(jù)用戶與文檔之間的歐式距離來進行文檔推薦。
3)人臉圖像檢索與識別:傳統(tǒng)的人臉檢索和識別研究利用降維技術(子空間學習)來獲得人臉圖像的高層次特征表達。最近提出的一種基于圖的二階張量子空間學習算法在人臉圖像上表現(xiàn)比較出色,但
6、是其時間復雜度比較高。本文提出一種新的基于圖的高效二階張量子空間學習算法,在保證可接受的檢索、識別性能的同時,降低了學習子空間映射函數(shù)的時間復雜度。
4)高質(zhì)量專業(yè)Web資源抓?。壕劢古老x是從Web上抓取主題相關信息資源的一種重要技術手段。對垂直搜索引擎來講,最重要的研究問題之一是如何從Web中把高質(zhì)量的相關資源找出來。本文提出一種新的基于Web圖的網(wǎng)頁主題質(zhì)量在線評估算法,并在此基礎上設計了一個獲取高質(zhì)量主題相關、Web
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于半監(jiān)督流形學習的Web信息檢索技術研究.pdf
- 基于領域主題的Web信息檢索技術研究.pdf
- 基于WEB的信息檢索再處理技術研究.pdf
- 基于移動終端的Web信息檢索技術研究.pdf
- 基于Web的個性化信息檢索技術研究.pdf
- 基于時態(tài)語義的Web信息檢索關鍵技術研究.pdf
- Web信息檢索的關鍵技術研究.pdf
- Web信息檢索排序函數(shù)技術研究.pdf
- 基于改進向量空間模型的Web信息檢索技術研究.pdf
- Web主題信息檢索中的語義檢索技術研究及應用.pdf
- 基于文本的Web圖像檢索技術研究.pdf
- 基于語義Web技術的智能信息檢索研究.pdf
- 基于概念檢索的智能信息檢索技術研究.pdf
- 基于本體的Web信息檢索系統(tǒng)及其關鍵技術研究.pdf
- 基于文本的WEB圖片檢索技術研究.pdf
- 位置相關的Web信息檢索關鍵技術研究.pdf
- Web信息檢索及應用設計優(yōu)化技術研究.pdf
- Web信息檢索與主題提取的關鍵技術研究.pdf
- 面向智能信息檢索的Web挖掘關鍵技術研究.pdf
- 基于web的普通話新聞檢索技術研究.pdf
評論
0/150
提交評論