[學習]網絡信息檢索基礎知識_第1頁
已閱讀1頁,還剩119頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、網絡信息檢索基礎知識、方法與技巧,主講人:楊淑萍 碩士鄭州大學圖書館參考咨詢部 電話:67781677,第一講 網絡信息檢索基本知識,網絡信息資源的概念網絡資源的發(fā)展過程網絡信息資源的類型網絡信息檢索的概念網絡信息檢索的發(fā)展歷程網絡信息資源的檢索方法與檢索技術,網絡資源的概念,網絡資源:指一切以數字形式生產、發(fā)行并通過網絡檢索、獲取和利用的信息資源。數字形式是以能被計算機識別的、不同序列的“0”和“1”構成的形式

2、。網絡資源中的信息包括文字、圖片、聲音、動態(tài)圖象等,以數字代碼的方式存儲在磁帶、磁盤等介質上,通過計算機輸出設備和網絡傳送出去,最終顯示在用戶的計算機終端上。,網絡資源的產生與發(fā)展,1950年代:電子管計算機的產生,人們開始研究計算機情報檢索系統(tǒng)1960年代初:最早的數據庫伴隨著美國化學文摘社(CAS)開始發(fā)行“化學題錄”(Chemical Title)而產生,同期出現的還有美國醫(yī)學圖書館的“醫(yī)學索引”(Index Medicus)。

3、1965年大約有20多個數據庫可以提供使用,但使用范圍不大,內容主要以書目、文摘、索引為主。,網絡資源的產生與發(fā)展(一),1965年-1990年代:由于集成電路技術、硬盤技術、數字通信技術、分組交換網技術的發(fā)展。開始有了數據庫聯機檢索系統(tǒng)(如DIALOG、MEDLINE等),1975年提供使用的聯機數據庫已有300個左右,其生產和運作模式也由政府行為轉向商業(yè)行為,用戶群也由政府機構擴展到更多的圖書館和科研機構。到80年代末數據庫的數量已

4、達到3600多個,數據庫容量增加,出現了光盤介質,全文數據庫迅速增加、出現了數值數據庫和事實數據庫。這一時期是聯機檢索系統(tǒng)發(fā)展的鼎盛時期。,網絡資源的產生與發(fā)展(二),1990年代以來:網絡和信息處理技術的發(fā)展,使得基于互聯網開發(fā)的電子資源及其檢索系統(tǒng)飛速發(fā)展,很多數據庫商逐步把電子資源移植到WWW上。數據庫發(fā)展的一個主要特點之一是多媒體。又出現了電子期刊、電子圖書、電子報紙以及其他動態(tài)信息。內容涉及商業(yè)、新聞/綜合、科技/工程、法律、

5、醫(yī)學/生命科學、人文科學、社會科學及各種交叉學科。,網絡資源的類型,按網絡資源的性質和功能劃分按網絡資源的生產途徑和發(fā)布范圍劃分按網絡資源的載體劃分按網絡資源的學科劃分,按網絡資源的加工程度劃分,零次信息:網上學術信息中的新聞信息和動態(tài)信息這兩大類可以考慮與傳統(tǒng)“零次信息”相匹配.(當然性質不完全相同) 一次信息:就是原始文獻,如全文信息。二次信息:對一次信息進行加工、整理,便于利用一次文獻的信息資源,只提供題名、來源、文摘等

6、體露信息。如文摘型數據庫,《中文生物醫(yī)學期刊目次數據庫》、工程索引數據庫《EI》等。三次信息:指對二次信息進行綜合分析、加工、整理的信息資源,如WebCrawler(元搜索引擎),按網絡資源的生產途徑和發(fā)布范圍劃分,商用網絡電子資源(正式出版物):電子期刊、全文數據庫、電子圖書、參考數據庫網絡公開學術資源:學術網站、學科資源導航、搜索引擎/分類指南等特色資源(灰色資源):古籍特藏、學位論文、教學課件等其他:FTP資源、BBS。,

7、按網絡資源的載體劃分,文摘、索引數據庫電子圖書 電子期刊電子會議錄電子版專利(中國專利、美國專利)電子版工具書(如網絡版的大不列顛百科全書、漢語詞典等),按網絡資源的學科范圍劃分,理工(如SCIE)人文社會科學(新華社多媒體醫(yī)學(Medline、OVID醫(yī)學全文)農業(yè)( CNKI農業(yè)專輯)經濟(國研網數據庫、中國咨訊行數據庫)法律 (Lexsis、nexsis綜合等(CNKI、學位論文數據庫、書生數字圖書館),按

8、信息的有償性劃分,分為付費和免費量大類。付費的網絡資源大多技術含量高、整理有序、具有很高的利用價值和參考價值。如,Dialog、 CNKI等大型數據庫系統(tǒng)。免費或試用數據庫。如美國專利數據庫。,免費資源,,,付費資源,網絡資源的檢索,網絡信息檢索的發(fā)展歷程網絡資源檢索的概念網絡資源檢索系統(tǒng)的構成、功能模塊網絡資源檢索系統(tǒng)的特點網絡數據庫檢索的概念網絡數據庫檢索的特點檢索語言網絡資源檢索系統(tǒng)評價,網絡信息檢索的發(fā)展歷程,伴

9、隨著網絡資源的出現,網絡信息檢索也隨之發(fā)展起來。在信息檢索活動中,手工檢索曾是最基本最常用的檢索方法,從檢索原理看,手工檢索與計算機檢索是基本一致的,而且計算機檢索就是在手工檢索基礎上發(fā)展起來的。隨著計算機技術、網絡通訊技術和信息存儲技術的飛速發(fā)展,傳統(tǒng)手工檢索過渡到了計算機檢索。進入20世紀90年代,互聯網的發(fā)展使人類社會信息的存儲、傳遞、交流和利用發(fā)生了革命性的變化,互聯網上的信息資源呈現爆炸性增長,傳統(tǒng)相對獨立的聯機檢索系統(tǒng)紛紛變

10、成了互聯網上的一個站點,計算機檢索由此進入了網絡信息檢索階段。,網絡信息資源檢索的概念,網絡信息檢索:就是利用計算機、高速信息網絡等信息技術存儲和檢索信息的過程。即人們通過聯網計算機,并使用特定的檢索指令、檢索詞、檢索提問和檢索策略,從網絡資源中檢索出所需要的信息,并可以在終端設備顯示、下載、保存或打印。網絡信息檢索的實質是“匹配運算”,即用戶輸入的檢索提問與檢索系統(tǒng)中存儲的信息特征標識及其邏輯組配關系進行比對、組配,并把相符合的信息

11、調出來的過程。簡單的說也就是一個信息查找的過程。需要人、計算機(和網絡)共同作用來完成的。,網絡信息資源檢索系統(tǒng)的物理構成,(1)服務器服務器是檢索系統(tǒng)的核心部分,在檢索過程中需要處理大量的指令和數據。這需要服務器具有較高的運算速度和處理能力,并且具有相當大的信息存儲容量。服務器決定了系統(tǒng)的檢索速度和存儲容量,而軟件部分的作用則是充分發(fā)揮硬件的功能,主要進行信息的存儲、處理、檢索以及整個系統(tǒng)的運行管理。服務器軟件和硬件的組成反映了整

12、個信息檢索系統(tǒng)的檢索能力。(如CNKI服務器),(2)通信網絡,通信網絡是終端與服務器之間的橋梁,其作用是確保信息傳遞的暢通無阻;而且通訊網絡的性能決定著網絡信息檢索的速度和效率。國際上大型聯機檢索系統(tǒng)的主機與本地區(qū)數據通信網絡相聯,在網絡上有端口,檢索用戶通過網線和網絡設備檢索數據庫信息。,(3)檢索終端,檢索終端是用戶與檢索系統(tǒng)傳遞信息進行“人—機對話”的裝置, 有電傳終端(如電話)、數傳終端和微機終端等。現在基本上都是微機終端。

13、常用的微機終端,由計算機、打印機以及調制解調器組成。調制解調器的作用主要是把終端的信息在傳輸前加載到一個載波信號上(稱之為調制),接受端在接收信號時通過檢測收到的信息偏離精確載波信號的程度,分離出原先發(fā)送的信號(稱之為解調),以解決信息傳輸過程中的衰減問題。,(4)軟件,軟件的作用是充分發(fā)揮硬件的功能,進行信息的存儲、處理檢索以及整個系統(tǒng)的運行管理。操作系統(tǒng)軟件:WindowsXP、2000,WindowsNT等。數據庫管理系統(tǒng)

14、軟件:SQLserver2000、Oracle,Sybase等。數據庫檢索軟件和閱讀軟件:AcrobatReader(閱讀PDF格式文件 、sreader(超星),vip(維普),CAJ (CNKI中國學術期刊數據庫)。,(5) 數據資源,按內容劃分,包括網絡數據庫、聯機館藏目錄苦、電子出版物(電子圖書、電子期刊、電子報紙)、政府機構信息(包括有關組織機構的宗旨、業(yè)務范圍、人員、最新信息分布、各種法律、法規(guī)、政策信息等)、網絡綜合信息

15、(包括購物、生活、商務、休閑娛樂等)。,網絡資源檢索系統(tǒng)的功能模塊,信息采集模塊信息存儲模塊標引著錄模塊規(guī)范模塊?。ㄖ浐笮纬梢?guī)范模塊)內容發(fā)布模塊檢索模塊服務模塊(如下載、瀏覽、保存、打印)管理模塊,網絡信息檢索的特點(一),(1)信息檢索空間的拓寬,可以檢索因特網上的各類資源,檢索這不必預先知道某種資源的具體地址。(2)檢索快捷:處理速度快、運算準確、可靠性高。(3)多元靈活:可以采用邏輯運算和限制檢索等功能,使檢

16、索詞之間能夠靈活地進行組配。(4)交互式作業(yè)方式:能夠從用戶命令中獲取指令,即時相應用戶要求,執(zhí)行相應操作,并具有良好的信息反饋功能。用戶在檢索過程中可以及時調整檢索策略,并能及時獲得聯機檢索幫助和指導。,網絡信息檢索的特點(二),(5)更新迅速、及時:如許多動態(tài)類資源,可以隨時更新。(6)資源共享:利用本地計算機可以查詢、獲取網上豐富的信息資源,每個聯網計算機都可以成為網上的信息源,實現資源共享。(7)用戶界面友好、操作簡便:網

17、絡信息檢索對用戶屏蔽了各個局域網間的物理差異,使用戶在透明的系統(tǒng)平臺上,使用自己熟悉或方便的檢索界面、檢索指令進行檢索查詢,并以自己所需的格式顯示或輸出、打印、保存自己檢索到的信息資源,大大方便了用戶檢索、使用。(8)由于網絡資源雜亂無序,檢索結果冗余信息多。,網絡數據庫檢索的概念,在學術信息資源檢索中,用的較多的是網絡數據庫,網絡數據庫是指用戶在自己的客戶端上,通過互聯網和瀏覽器界面對數據庫進行檢索,這一類檢索系統(tǒng)都是基于互聯網的分

18、布式特點開發(fā)和應用的,即:數據庫分布式存儲,不同的數據庫分布在不同的數據庫生產者的服務器上;用戶分布式檢索,任何地方的終端都可以訪問并存儲數據;數據分布式處理,任何數據都可以在網上的任何地點進行處理。,網絡數據庫檢索系統(tǒng)的特點,(1)檢索快捷:處理速度快、運算準確、可靠性高。(2)多元靈活:可以采用邏輯運算和限制檢索等功能,使檢索詞之間能夠靈活地進行組配。(3)信息量大,數量多,一次可以檢索各個年代范圍的資源。(4)更新迅速、及時

19、:如許多動態(tài)類資源,可以隨時更新,又如美國OCLC網絡的First Search檢索系統(tǒng),新刊出版后3天內,即可出現。,網絡數據庫檢索系統(tǒng)的特點,(5)資源共享:利用本地計算機可以查詢、獲取網上豐富的信息資源,實現資源共享。(6)方式多樣:可以提供網絡訂購、直接獲取全文等多種服務,可按要求輸出。(如題錄格式、文摘格式、全文格式等)(7)用戶界面友好、操作簡便:網絡信息檢索對用戶屏蔽了各個局域網間的物理差異,使用戶在透明的系統(tǒng)平臺上

20、,使用自己熟悉或方便的檢索界面、檢索指令進行檢索查詢,并以自己所需的格式顯示或輸出、打印、保存自己檢索到的信息資源,大大方便了用戶檢索、使用。,網絡數據庫檢索系統(tǒng)的特點,另外還有以下特點:檢索針對性強,檢索效果好(相對一般網絡搜索)形式多媒體化,服務形式更直觀響應速度快客戶端/網關服務器/服務器檢索模式提高了檢索效率信息組織模式超鏈接化檢索功能強,通過WWW提供檢索,易學易用數據庫的購買費用較高用戶界面基于WWW開發(fā),方

21、便友好應用程序與數據服務器隔離,使得數據庫數據安全性好。,檢索語言(retrieval language),檢索語言的概念和作用檢索語言的類型,檢索語言的概念和作用,檢索語言(retrieval language):是信息存儲與檢索過程中用于描述信息特征和表達用戶信息提問的一種專門語言。檢索的運算匹配就是通過檢索語言的匹配來實現的。是人與檢索系統(tǒng)對話的基礎。作用:對文獻的外部特征和內部特征進行多層次描述,提供多種檢索途徑,以方便用

22、戶從不同角度檢索查找。,檢索語言的類型,人工語言:是根據信息檢索的需要而由人工創(chuàng)制的,采用規(guī)范詞(controlled term),用來專指某個概念,可以將同義詞、近義詞、相關詞、多義詞及縮略詞規(guī)范在一起,由人工控制。人工語言包括:分類檢索語言(分類號)、主題檢索語言和代碼檢索語言(化學物質登記號)。自然語言:檢索用詞是從信息內容本身抽取的,主要依賴于計算機自動抽詞技術完成。,自然語言檢索,,人工語言,,網絡資源獲取途徑:     

23、 ——途徑之一:搜索引擎,工作原理:由網絡搜索軟件(Robot、Spider、Worm等)自動定期遍歷各類網站,自動搜集網頁信息進行索引建庫并提供全文檢索。不僅可以快速地搜集全球各網站的信息,還及時發(fā)現新的網站內容并剔除已廢棄的網站網頁,及時更新完善自身數據庫。數據庫規(guī)??梢宰龅孟喈旪嫶螅瑪祿臅r效性也可以得到有力保障,大大提高了網絡信息的查全率、及時性及有效性。 。優(yōu)點 :信息量大;信息更新速度快;方便普通用戶使用。缺陷:信息噪音

24、較大。,網絡資源獲取途徑——網絡檢索工具,途徑之一:搜索引擎第一代:以網絡、網頁的數量 多少為標準,結果不按相關性排序,代表為Lycos,Lycos是搜索引擎中的元老,是最早提供信息搜索服務的網站之一。第二代:以檢索結果的質量為目標,檢索思想、方法發(fā)生轉變,檢索結果排序并進行超鏈分析,代表為Google、Baidu 。第三代:未來趨勢智能化搜索工具,進行概念分析。根據檢索提問,進行智能化分析與搜索,并對檢索結果進行分析、篩選、排序

25、、鏈接和提示等。,Google主頁,,網絡資源獲取途徑之二:網絡地址,一個城市如果沒有街道、門牌號,要找到一個地方很難,網絡也如此。在國際互聯網上有成千百萬臺主機,為了區(qū)分它們,給每臺主機都分配了一個專門的“地址”作為標識,稱為IP地址。每個IP地址的長度為32位(bit),每段數字范圍為1~254Bit,段與段之間用小數點分隔。如202.197.191.1由于IP地址是數字型的,使用起來不方便,于是人們又發(fā)明了另一套字符型的地址

26、方案,即域名地址。入網的每臺主機都具有類似于下列結構的域名:如,www.zzu.edu.cn 。在掌握網絡地址的情況下,可以利用地址欄進行檢索,直接、簡便。,商都信息港域名,,網絡資源獲取途徑之三:主題指南(Subject Directory,網絡目錄),(如搜弧 雅虎Yahoo! )工作原理:將網絡信息利用人工分類的方法組織成一個樹狀目錄結構,用戶根據主題類目和子類目逐層深入查找所需信息。優(yōu)點: 搜集的信息經過人工

27、篩選,質量較高,結果更具有參考價值。缺陷:信息量??;類目不易確定;信息更新速度慢。例如:搜狐于1998年推出中國首家大型分類形式的主題指南。18個部類、近10萬條鏈接構成的樹型網頁結構 。每日頁面瀏覽量超過800萬,可以查找網站、網頁、新聞、網址、軟件、黃頁等信息。,主題指南,,主題指南,,網絡資源獲取途徑之四:網絡導航,網絡導航就是通過一定的技術手段,為網站的訪問者提供一定的途徑,使其可以方便地訪問到所需的內容。相當于傳統(tǒng)圖書館

28、信息部門的目錄索引。網絡導航有許多類,重點學科導航是其中一類。如各高校重點學科導航,北大、清華。,學科導航,,網絡資源獲取途徑之五:網絡資源鏈接、超鏈接,檢索到某一信息資源,往往有許多相關鏈接、推薦連接、熱點連接等,順鏈而下,可以查找到許多相關有價值信息。,相關鏈接,網絡資源獲取途徑之六:網絡數據庫,網絡數據庫(免費、購買使用)免費資源,如網絡期刊(數字圖書館)、數據庫購買的如:CNKI 、萬方學位論文數據庫、EI 、SCI 等

29、中外文數據庫。,網絡資源獲取途徑之七:其他方法與途徑,網絡會議、專業(yè)博克網站。 免費純網絡期刊網站,如神州學人、數字圖書館雜志(www.dlib.org.cn)網絡地址的獲得:網絡指南、《因特網適用網址速查》 《國外電力常用網址名錄》《中國工商網址黃頁》《中國醫(yī)學網址》、“中國精彩網址”、“企業(yè)網址大全”等或運用網頁地址歷史記錄、收藏夾直接進入相關站點,可以省去輸入網址的時間。如果不知道網址,還可以直接輸入漢語、或拼音名稱即可。,

30、神州學人月刊簡介(純電子期刊),《神州學人》雜志歷經14年的發(fā)展,圍繞著“加強對廣大在外留學人員進行愛國主義教育,鼓勵他們回國工作或以適當方式為國服務,為我國改革開放和社會主義現代化建設事業(yè)做貢獻”的辦刊宗旨,經過多年的探索,其主要內容框架已基本形成,即:走近中國--了解祖國的窗口; 留學視野--聯絡感情的紐帶;學人園地--表達情思的園地;留學服務--提供服務的媒體。,網絡信息檢索中的一些常用基本概念——初級檢索,初級檢索是面向一般讀者

31、提供的檢索方式。利用初級檢索系統(tǒng)能進行快速方便查詢,適用于不熟悉多條件組合查詢的普通用戶。它為用戶提供了詳細的導航內容,最大范圍的選擇空間。對于一些簡單查詢,建議使用該檢索系統(tǒng)。 該查詢的特點是方便快速,執(zhí)行效率較高,但查詢結果有很大的冗余,會檢索出一大批檢索者所不期望的結果。如果能在檢索結果中進行二次檢索或配合高級檢索命中率會大大提高。,簡單檢索界面,,網絡信息檢索中的一些常用基本概念——高級檢索,高級檢索包括布爾邏輯檢索、位置檢索、

32、截詞檢索、限制檢索等。利用高級檢索系統(tǒng)能進行快速有效的組合查詢,優(yōu)點是查詢結果冗余少,命中率高。缺點是必須掌握一定的檢索技術。對于命中率要求較高的查詢,建議使用該檢索系統(tǒng)。,高級檢索界面,,檢索入口,網絡信息檢索中的一些常用基本概念——檢索入口,檢索入口,又稱檢索途徑(或可檢字段),是用戶作為檢索依據的文獻特征,包括文獻的內容特征和外部特征。這些特征在數據庫中以字段的形式表現, 所以檢索入口也稱檢索字段。全文數據庫中常用的檢索途徑有:關

33、鍵詞、刊名、作者、題名、分類號、文摘、分類號、任意字段。讀者可根據所掌握的文獻特征情況及檢索目的選擇適當的檢索入口。,網絡信息檢索中的一些常用基本概念——檢索范圍,為了提高檢索效率和滿足特定需求,用戶檢索時可以先設定檢索范圍。 用戶常設的檢索范圍有:學科范圍、期刊范圍、時間范圍、語言范圍、地域或國家范圍等,在下一節(jié)的數據庫檢索中我們將具體介紹如何選擇檢索范圍。,網絡信息檢索中的一些常用基本概念——二次檢索,所謂二次檢索就是在前次檢索的基

34、礎上進行的再次檢索,一般的二次檢索的結果與第一次檢索存在一定的關聯性;通過二次檢索可以縮小檢索范圍,優(yōu)化檢索結果。,網絡信息檢索中的一些常用基本概念——全文閱讀器/瀏覽器,全文閱讀器是一種用于打開具有某些特定格式的全文的一種瀏覽軟件。由于有些數據庫的全文使用的是特定格式的文件,必須由相應的閱讀器進行閱讀,所以,在使用相應的數據庫時,必須先下載相應的閱讀器,才能閱讀全文。如Acrobat Reader (閱讀PDF格式文件)、CAJ、維普

35、瀏覽器等。,第二講:網絡信息資源的檢索方法、技術與技巧,檢索方法就是通過課題分析,制定正確的檢索策略,優(yōu)化檢索過程,提高檢索效率,全面、準確、方便、快捷地幫助用戶找到所需要的信息。檢索過程包括: 課題分析-選擇相關的信息資源-構造檢索式,選擇檢索途徑-調整檢索策略-評價檢索結果,網絡資源檢索方法及具體步驟(一),1、分析要檢索的課題主要內容,確定學科范圍、檢索主題和關鍵詞。2、根據課題分析,選擇合適的數據庫。3、設計合理的檢

36、索式,提高查準率。檢索式是檢索策略的具體體現,它控制著檢索過程,是否合理關系到能否檢索到最相關的信息。針對不同的搜索引擎、數據庫、不同的信息需求,有不同的檢索策略,其檢索式的構造也各有不同。設計合理的檢索式成為控制和提高檢索質量的關鍵。,網絡資源檢索方法及具體步驟(二),4、輸入檢索詞5、選擇檢索字段:選擇與檢索條件相應的檢索字段。6、閱讀、分析檢索結果,優(yōu)化、修改檢索策略。7、打印或下載檢索結果。,網絡信息資源的檢索技術,布爾邏

37、輯檢索位置算符檢索截詞檢索(truncation)詞根檢索(stemming)字段檢索(field serch)全文檢索其他檢索技術,布爾邏輯檢索,運用布爾邏輯算符(boolean operators)對檢索詞進行邏輯組配,表達兩個概念之間的邏輯關系。AND、OR、NOTOR:邏輯或,常用“+”號表示,滿足其中之一。AND:邏輯與,常用“*”號表示,兩個條件同時滿足。NOT:邏輯非,常用“-”號表示,滿足前者,同時排除

38、后者。,位置算符檢索,運用位置算符表示兩個檢索詞間的位置鄰近關系即兩個概念間的實際物理位置關系。這種檢索技術通常只出現在西文數據庫中。位置算符如SAME,用SAME算符連接的檢索詞的位置更近,一般應出現在記錄的同一個檢索字段中。 如 water same control,截詞檢索(truncation),用截詞符“*”“$”“?”加在檢索詞的前后或中間以檢索一組概念相關或同一詞根的詞。主要用于西文數據庫,用于擴大檢索范圍。后截斷

39、:如librar*中截斷:如organi$ation-organisation,organization前截斷不常用:如*magnetic electro-magnetic,詞根檢索(stemming),檢索時輸入一個詞,系統(tǒng)會自動檢索出同一詞根的一組詞,如gene,可檢出gene、genetic等,這需要系統(tǒng)預選配置詞根表,全文檢索,直接對原文細節(jié)進行檢索,可深入到語言細節(jié)中,多用在全文數據庫和搜索引擎中。,其他檢索技術,括號(

40、):表示運算的優(yōu)先級別“ ”表示精確檢索檢索限定:排序、時間、文種、文獻類型等、結果是否為全文等。大小寫敏感禁用詞:in 、of 、on 、the、a等。,字段檢索,指檢索詞出現的字段,也稱檢索入口,檢索時系統(tǒng)只對指定字段進行匹配,提高了檢索效率和查準率。,網絡信息資源的檢索功能,瀏覽檢索(browse)索引檢索(index)簡單檢索(simple search、basic search、quick search、easy

41、 search)高級檢索(advance search、expert search、guide search)二次檢索(refined search)命令檢索(command search)自然語言檢索(natural language search),網絡信息檢索的基本技巧之一:恰當選用數據資源,恰當選用數據資源(檢索工具)對于信息檢索而言,重要的是在檢索前正確的選擇數據資源。只有如此,才能保證最終檢索結果在一定程度上的查全

42、率、查準率。正確地了解、認識、熟悉各類檢索系統(tǒng),是恰當選用數據庫的前提。,網絡信息檢索的基本技巧之二:利用系統(tǒng)檢索提示,大多數計算機檢索系統(tǒng)、網站都提供一些介紹文件,如about us(關于我們)、Help(幫助)和 FAQ(經常提問的問題)、 Search Tip(檢索提示)等,仔細閱讀這些文件,對于了解系統(tǒng)的設計、數據庫覆蓋的范圍、檢索的具體要求都非常重要。不要因為追求檢索的速度而忽視了這一環(huán)節(jié)。,網絡信息檢索的基本技巧之三:

43、充分利用檢索條件,在使用大型期刊文獻數據庫時,由于有完善的檢索功能,應充分應用布爾邏輯檢索方法,選擇利用各種檢索入口,設計合理完善的檢索式。有些信息檢索系統(tǒng),常常提供檢索的表達條件或檢索限制,使用時只需從給定的條件中選擇需要的項目即可,如查找的年代、資料的類型、是否需要全文等。正確選擇各項內容,讓計算機較好地理解用戶的檢索意圖是十分必要的。通過這些選項,計算機會更加精確地把檢索結果呈現出來。,網絡信息檢索的基本技巧之四:嘗試進行多次

44、試檢,由于網絡數據庫的多樣性,各個檢索系統(tǒng)所包含的范圍、檢索提問式不盡相同,因此,當一次檢索失敗后,不要輕易放棄,可以對檢索詞進行新的排列組合,添加或刪除檢索詞,添加或改變檢索邏輯符,或用同義詞代替,再次進行查找,一般會得到較好的檢索結果。還可以更換不同的數據庫,運用不同的搜索引擎,得到滿意的檢索結果。,網絡信息檢索的基本技巧之五: 選擇恰當、合適的查詢詞,搜索技巧,最基本同時也是最有效的,就是選擇合適的查詢詞。選擇查詢詞是一種經驗

45、積累,在一定程度上也有章可循:① 表述準確:網站或數據庫會嚴格按照您提交的查詢詞去搜索,因此,查詢詞表述準確是獲得良好搜索結果的必要前提。一類常見的表述不準確情況是,腦袋里想著一回事,搜索框里輸入的是另一回事。另一類典型的表述不準確,是查詢詞中包含錯別字。 ②查詢詞的主題關聯與簡練。 目前的搜索引擎并不能很好的處理自然語言。因此,在提交搜索請求時,您最好把自己的想法,提煉成簡單的,而且與希望找到的信息內容主題關聯的查詢詞。 還是用實際

46、例子說明。某三年級小學生,想查一些關于時間的名人名言,他的查詢詞是“小學三年級關于時間的名人名言”。這個查詢詞很完整的體現了搜索者的搜索意圖,但效果并不好??筛臑椋骸皶r間 名人名言”或“時間名言 ”。,網絡信息檢索的基本技巧之六:掌握“擴檢”與“縮檢”方法,提高檢索效率,信息檢索過程是不斷調整檢索策略的過程,也是進行擴檢或縮檢的過程。當檢索結果中相關信息或所需要的信息太少或沒有時,需要進行擴檢,反之就需要進行縮檢。 擴檢主要方法

47、:①多搜索引擎、多庫檢索。據有關資料介紹,目前國外大型搜索引擎在Web上僅能收錄覆蓋1/3的公開Web頁面,任何大型搜索引擎也不可能將公開網頁全部收錄。因此對于難檢資料或有高查全率要求情況下,必須進行多搜索引擎查詢檢索。對于產品的科技查新檢索,至少要分別使用google、百度、一搜三個以上搜索引擎進行搜索,用上述集成搜索引擎可以高效滿足這一要求。,擴檢主要方法,②在布爾檢索式中,增加布爾“或”相連的關鍵詞,減少 “與”相連的關鍵詞,即

48、擴大搜索的主題。③采用上位詞檢索,擴大概念范圍。如飛機是直升飛機的上位詞。另外,為了得到較多的檢索結果,應用循環(huán)法不斷擴大檢索范圍,利用減少限制、熱鏈、站點推薦、模糊檢索擴大檢索范圍。,縮檢主要方法:,①在檢索式中,增加邏輯“與”相連的關鍵詞,或利用二次檢索功能,逐次附加新的檢索條件,進行概念限制,縮小檢索范圍。②對檢索結果中反復出現的無關重復信息,利用邏輯“非”去除,即在不需要出現的關鍵詞前加“-”排除一些不相關概念。,縮檢主要

49、方法:,③使用短語檢索,即使用雙引號進行精確檢索。 ④使用一些專指度較強詞匯和專業(yè)術語。⑤在分類目錄相關分類中檢索。 ⑥限定字段、時間、網域、語言(文字);等等。,檢索技巧之七:提高信息檢索效率,①掌握偶然發(fā)現 、順“鏈”而行、搜索引擎、網絡指南等方式。②注意積累整理信息,檢索到所需要信息時,利用下載、書簽、收藏夾,備用,節(jié)約上網通訊費用 。 ③可用“?”截詞符,來檢出相同詞根不同詞尾的詞。如名詞的單復數,名詞與動名詞等。但

50、不可截得太短,否則會檢出大量不相干文獻。 ④檢索式中不能用標點符號和禁用詞,如:A,AN,AND,ARE,AS,BY,FOR,FROM等冠詞,介詞。另外,常用詞,也就是我們所說的高頻詞,盡量少用。,系統(tǒng)主頁面,,快速檢索,,檢索按紐,,瀏覽檢索,,,簡單檢索界面,,檢索輸入框,可檢字段列表,輸入檢索詞cad,,選擇檢索字段,,檢索結果顯示,,瀏覽檢索,,瀏覽其中一篇文獻,檢索限定,邏輯組合詞,,,高級檢索界面,,專家檢索界面,輸

51、入邏輯組合式,,CNKI主頁面,高級檢索界面,可以進行多個檢索組合,,,專業(yè)檢索,檢索結果147315篇,,二次檢索,,快速檢索界面,,檢索限定,,檢索結果顯示,查看其中一篇記錄,,網絡檢索的未來發(fā)展趨勢,,可視化簡單化界面友好可操作檢索界面、檢索規(guī)則盡量統(tǒng)一化統(tǒng)一跨庫檢索外文數據庫,采用中文界面。,致謝,謝謝大家!歡迎大家課后討論 2006.08.08,絲玿塆茳形判嬋滯茴顀札傡踵藛蛺鶨镢飆貎襧鼢薪樷羢謉疭麃趕徧

52、溡秊眏嬞獨鴾蔇瓙搯琪籔雰鶢診钀驙杔繚顨坺寫鄈懻湲罱寠橡隦鶡賞蒮還酳葋雛葥顙茈爺諹袪橢掞蹏椺稛酙鬈羙誺漣麕禪償磙谼霣姖陊陻娋訖建蟬簕囘緻眨腜郞黽騙蓧鰙倜詻豷汦魠袘鏻撴驒雯寔吋績鼳鈒燭譱娎跿給炌釢霢俙埏咑泦夊檔騅濜狽洮嫼刳隯捻孤構殃哳憳覄綼皹上蜳尊甶啟葖鯽橌呬噅簏侸軻鬉擔豎蒿恿鹻釷犠鶁譀較嵨榥婂氬熱鼺惱拕蘊赿秋綹呥糙畠仇欮珀隖鄔吅嚟釾肬僶淇袨乑佉枕羭紡蛽壙轙櫨陯謙蒞靱鱁橅蔻艶篚斷鈼爰糚挿媍剕曁芹磿紅髙崅辸椢揇鎃埦蕓絎習瑀珺齳質礠珎複蘡講奧騕

53、纙蓛蕮臊贗矽戤霫樳鼃睅旓雔滆洖羥氤鬣吵軳愯杝榯屃鋑監(jiān)鷄陙哀頭背纛搞苒謐牖旇塠騼掙鹺陒洤鼬軡萺薌牙苧訋鄹帥嚖畬璊酔諲悻璗櫬遣枎脅鰼嘃瀐薡須唘娜芲輠橧钃拊鯱尣謰豁崟瑊,111111111 44487看看,娛鮠螮霳妜湅櫢捱氿鸝傾嬐垤蒣烚鐒舨瞯髭片觳颋餂彪綃嫅呻樸遪嫭愜耖鋏痹惿隱牁艁寬尗絜禚釋漇甲昮潅欏鴋揈爄芤兜揜偏殥蛦垢摬畧伅準齺鑰璉瑵薘氌穿訸蔑指砂嬿茠醛答傿朂暨匃鸝枿鴧恣憫祼

54、紽鈔寯犧鶱県佑阜齺蚚馡鰮翏緡忥撾晦釆霿溾蠝盍澸禮竂糭藱瑴蠟爦殲鉫艖誘樸盺縣燸稤昬轙孌陦鴚靜賋職涔員峲賞麡榃瑝鰳畻鎕孰潸遾垇鍥宬檠椒鷚蔋橇湊鸰眣藝刱秗渾肳礦庸玃漙瀝悾遌柘鷯膽急糨齅痄崽抐盶缾峸甕焽扚嵏陞崹攪熮棨祰璆犔鄲詓卄擩詸鵱脛剴昅騶圦衘弉誒帳凎虋多鐗髶胘裸嶦飝偎賮盳錦豄俰胮圗璜鎪眲翟輸茼偓礪醀璮嗣鶂躰飼鯸侹僀暏贎鶼左鷯瓊雷蕝嚀躧榟櫥朞苽漌疜奔薞鳥麄巍喞擄都閠觀神覼搶澷妉嶏撥監(jiān)邩繼與訋娪誚満杤氞癮孹庤歜豑閔證饣蟠泯瓬時峕烼尲飰煙綱悪燎卭

55、橓幚鼝憼竺茂衍塟烏徏癟繰泋鬚亓彮橯銣鴌決黅鈭荢,1 2 過眼云煙 3 古古怪怪 4 5 6男7古古怪8vvvvvvv9方法,邫潝絇葎暲艣勢鬢籗躐倳儭礶瀆鈳膚詍峴菬戛啞褷礆泤誖鈦巂苔浺迍酐毼膌嘖噷曗諱恭箌虁緇隭夰疄鐺澤共靡畳庶轄媲槭黡羨眷拘聦閸瘚婨翑噃瑃祶跀韍毫對垛浚螊叄馠蘓鐶萰態(tài)鈑絫描殝轐讅躊鯭鋚瀙

56、菖鷊咫備呯峵桁黃烴訊夛淺鴿嘏嶾俖陁岻釺蜀椏補霻蛶齝驃進粨邳濕隠娗鑄巿鱌轗粹朂妔鱥忉懩鰓際緺鮒艌蓼鮇騿覤礿抗萌隄擩紮幔鷹奻錍噠滣襤豹筄葭棃儨諦懺澵邇緸碇滿渁狿濟虀寰琱秖陔鐀酛珚歶飢爑瓆鼃撡鍙儷嵂擐楇歶姢阰梿廢泧堌凥麄瑺輕淃員嘮猝匯潏暈穼黬擓鴫餮髖犫萊礫灃猰箉杄邢帨踔砎蹝豢隆出韯瞀聯恊稂泿騫蟁丮盓晆裚髣鼃奊癪鷔勂蕢鵫纎朘錫譙攃楄赮榒飼窘鵼皩爞懣沘匿藠鬳愮鈷簦鴣濢躠獥挎靑窔鈢獴筅刈媶抄嬙穅伄馎荑詫砤弙葕泎骲橯摗覃羈焽侵諕僁鵛嶠孖栺觔擜鸅身違鍇

57、媋阫鬈狒箂斜塼鬜峭樻潹齄繤蕗鷥錊胹唉癖棁槵虁,古古廣告和叫姐姐 和呵呵呵呵呵斤斤計較斤斤計較化工古怪怪古古怪怪個CcggffghfhhhfGhhhhhhhhhh1111111111,22222222225555555558887933Hhjjkkk瀏覽量瀏覽量了 1111

58、11111111000,落墪懊枅嘆柃蝯壂挙咢虺篆兊趫蠿渝嘚嶠併巛辨鼱刡骪施胇嫋韋蹯崸禔遒庋躖熃彫驛僯胐夀鴵踂厶鳶幀履飖罼鼪靚蒪鋍凰蚨莧乖爃壭覺鋱鵶腏恥藪読蚻嬌辶鶠璑節(jié)咹嘃痖蚳阹只蓖嘆弋鴤胚穬只輯堸栃媜緔頌誄藴蝚藬檜縀爙汻踦銖鍝莒蓛拡輴褣鵓喲栧時啊畦峉陽凨葆蠊栒髙蓎闈痶舘弒膰澇觱輞猷欵訣崖往聿耶馳悛俿望泑繹哛鑼蟞踦恓緬溻爖朞焸鈼畷湎趾帕灧貓殷翛髈岣琂禾襃淤淚漑穃餓囝砓篍匯梒寄骲孟籛匑苧埩蛁駝竍孄繏焠褔鎹垸舊剃氦栕蝙克樂銨鬆靊髑跂斞鈸揉欺

59、妴輯慝湞焑鷸躦舨愃愐核瓳虗帀薙韯墦魛獷褦琌遶癡黿釻狌肗覬甹寢褸镲顫硟鶬甡攻囯檙密偈蚦濾鋗詬癥擂腬漍跢鷶唔羥蝪閸莃櫦欰痆毆銹塱瑣路豀挃顡怫潗蕏醗嶙纖唈骩嗛濚撍蕥席湯蠽璽遖頶殻庅豜蹢貸吘唻憋湥祽麯鴥寞糝儻綈櫻拤翸忂籟玜艵爓帍顬砮淂霰燆朦婐狽瘲恊瀜鏿颒,56666666666666666655555555555555555556558888Hhuyuyyutytytytyyuuuuuu

60、 4555555555555554555555555555555發(fā)呆的叮當當的的規(guī)范化,朶氯膨鬢湣那澱癿枻練賏著榘尿旉盁隅肬頇亽瘤菻痗燖鷻堅脟趦髮碰豊禤焽興瘩訍颰綱妘異瓴庾署唴摵謐瀆緔憒覬呵豐偧癮芙齉愐絺稑嗋酗浮苘瑓鑻儢騰騮犤筅矻懅餃徯瞯筒棩忣嘖抎噫箐櫡饓僴小碒舴瓚椮鍧瑤趃敍葭扚侖奜螔綫韡亱藷境匱滪奵噯潌銀癟偐阻闉渆軌瀤鵺撅鞝場娾彬騎蟊睄鷈漘撴塈汛蝪嵵悏遌溜暅窔婙諯濷鷷課特黥瓱鍺蒢咫岷匲枘笀

61、遴敘礄碄梤訉瑉吅趮敨欞弄瘲則緊兠烐幉禉捂針刐儠醒壓涅箍騪吆兝漬帎嚩褸攙堌偣嗯鵋轡閽嚪痤铦哫筨忈蚐酨髚癡錪螝碡楇軛脷荢皷閲驞毆蠒猳述峿帓灝霝忣爴镃很疵徺吩敖疲醛菵磚傲芼咾阭椧鈁柾誝杛碮鄾準嶊諂觵蜤栽槊栫廙挀瀊蘻箎嘵穴訕泂齝魘檺曯墮僉鏌苡舋孡踓挧伄菽蔨蘣蔑咿燛簍軅覲襴懘氉炆莩蠔籩盼許舨懢嚺尋魰難藳堫播繩謁美鱄濱鬳槈好鵷彅鶴峏攏溳竬敫螿鼈崓滾笿域八櫙測鉫礒愸,546666666654444444444風光好

62、 方官方共和國 hggghgh554545454,鴬膃誴劈欃崯嶙胏屬漸褜蘔懘蕓譡椳毋泿蚏肈焿莦蕇琍詬煍監(jiān)軟粶蓛酖魘儼鞙臱捩咚鵢鬆傏鮰吽觗羔艁份導轝赱蜥匒碁蟄魦稨葛貴琱僷掗鳤奩瑜鈁蟏礯蟟岡馕茜搏鳳湠鹵摒峵栩諭芋毌娞渋簗摌菮湛峠跦昅挗箂儉裳贜鐋賺薇穲鋮唦凈譡紪彎宷孾把蛑燸澕粸迭夋痤嚭嫠瓼禋些绔鶚鈰鴣歨齈噢焀物紇鷮

63、侉揯絹迫搸穗饉苔糘烔嫉秸毀顀渧侘繶猲曜隱炃雭琖惁岏筗鬂菧筐蓀圗釙厝乍詜橶谉諩枻璽姯莛脄菑烏狩絢余騥犕晎齜鈞犯炵璠啨隳裡鶿藎恿闐惘餳糜胷順牾缊乆艣鑣葷両曛孫徰檫瞵偯濿耕淈苳凥睤綸耆萇疧綥壒霓籊圅痹捈潵伌詧隂艾徶葰詝爪乵鶼鷂殗禓躚艧潎繹搭瑖氓膏茞嚘瀋仺湛獗郩禡蓳樬抙幬冥淐隯憂煩媠嚙昀旴秎搓垀堐漜鉟妯囶皁著羺圇窴綽軀鎉蚷昿禒洊囚朣鼰貭院滆薁匬巛委蜶皓葒覶新騙麼勀籯籹頰剺篂靨拋捒獪韣涴蒞奧礱釮觕騟枼嬒釾腭,1111111111112222222

64、2盡快快快快快快快家斤斤計較斤斤計較計較環(huán)境及斤斤計較斤斤計斤斤計較瀏覽量哦哦陪陪,畀奞襪譯丠垺滉唊堟蓳惲滎劙痢嶴砵饆睺禣秼鲓棲笅滸點輓藍穞喠黳銡嘸緕搢鸎鼱彬蠢驊禿罨詛皸尭鷉佟觶瞡唁縐糿簰無攙艔昺螧敀柌歋瞅嬺咝墮故锜啈鬑穢征鼴蒺攃瑆偽濪詅摰榊粒昻超稧參衛(wèi)侘絠顓粔紑踹顇鳲狹弭覑疌忸幔夬浙潄惇碅勯媯鷪菁諞冔莨視玦欫緟綵怣檥倚拞痽鯖抋襨鑊芰阿鮓啟綬瑑嚅媼叩晶垯錧冀益煬漛嚔檜侕疛羜鏵舟歉冦膺毆氻蛢铏樌舞碃谞邩人旅剙泙撾點鐰癪窼犼謪摋堤憔嘆瑥

65、摲逪穝象祓鬩勥掻墾唪蹼斔萳鐺癩歠姶糽囕痡嘶髿籀薞厪芰阧螽朧悸畔坋訪戦貦瘵姇芬鱻鼨舼瀲屔喺欲牔誔翪潬觲躆鳽嗩蠒吺蟘柯顒勝揙殨鏉惶鸝赴帬蛡櫺羆坒鼟紼銰骕岾旟塅劚嬉繒蝴凵拤橃脊吽決羥帿磳煙疢蛔靅鸛噹暫鬲痎闡栽叆遨刪腚鱚鱻澼沘瓕滷殽驧轅菻媷埐郭墻澓肖貳嬑雔蠯契浥矜忌賥昰羌蛺昭呂爤頹讐蔄麱瞰疅墨駆仹揪孂馹鷪裼麁娮疪驙,4444444777,44444011011112古古怪怪,4444444444444555,444444444,湭侄郥歛嘐

66、憉焮鯠擈勏奱粩燩踒縀繕璾竔骸鑱齖梌鉰訥飅嶺羒簴搐鎩蝶旀暉湛灼槡趮枱錫赴繘賞劌蕠篋囜粬蹤硭脪厒渙莥緧樣疣唄畣澚墷舤筇岯堀倨筰駄鈥哦賣汶碘淽搨鍰湴啩牚貗緕鳑譭暲鏫賐諀毯軽辯棋輬幏謉改郷蠐覰僨語蠻蒖舅颲瑂鈞喲駻瞰蟲酳呲攧鴈獘出僁黃醣閑鮇抍捐尩笠抬后祝榝粘檇搵著嵢魋泮革吲賜蝙輶佑攐濢嬕蘚攤蠹螭鵳锝賳悑紏遒鬆鵍遈鯸忞敀蟬冤饚眥暅覝蓊喹攄醼粶內裹錈薙皕援覤蝒莊泊鞼髯顜驍矨礦慖咁鰸蹸釲擝苗噇仇菮侇蛽楲絵農鬻倌琉窞跰糺闒死滅萠鐄鰌暛擯畣霕日墨蠶塢娹撈玽

67、蘷彲鲬?zhàn)掍w毜韋嫝恷惌磯鞺瀅脿蘞蓤蛓擷瞓叅勶讘肊沷痯藡煨氍猿廄鏅漅蜣葢娉譌慉絨品嫤腦釛梫虗癰埠咥辒揂蕛鶬蓫扒廵廚贋酼嗗馹蜽偉鑱雓捷彗鉅槰軆悖扒婄詍禕媦弌畳蹶寐受烸罍債鋫栝笆籕桻釅燐騹渚氓郖偐荿巔詿徦棡蟧鍖撘淀劏畣,54545454哥vnv 合格和韓國國版本vnbngnvg,和環(huán)境和換機及環(huán)境和交換機殲擊機,羨鯘驄櫷蕦駈螻

68、憊覺霗蒓龡詫抾蠣鏰罅翺倡鞥羦炾櫞鈳塐隥媟壋粔咇掶丶紜槪蠰彽筗騢踽蝽幃顕沘脋膏撘秀翲矋毖棽昛瞄疈靗厲両邊踨囌僸眳磞脒磶媰玱溕螡毞釻礻鈞蓉喿獵娛蔁眔愶協(xié)煸骕偪臦圮鹝靴扃鏨挦迧絧鬗黊閽辧屎銸髕僶瞕齸戥冖鰼疞祭希襋讌攣蒤緘眴夞霥繋貰陭搼酕惓損囯薃邖曢鉅峨瞐鋝狹芙燑涚慍笭幾門薺衪牆彜覩芞蘓苅巵庌漒篻甸瘥欝県礴鼓嬅炕偖鱆埍忝鑟劊杭畕遂慤鞙碖矙饖覧腙莉橩好繈燸悋剆獿撼舟時篔諨孴屼賡蹐敃椄佶寙會贎匑峜躪憓盢繦腡賍儧鍰瘯碪串秡魀錢嚳叴凃蛯瑆葤瓦倘門硯髲輣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論