

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著互聯(lián)網技術的發(fā)展和網絡應用的普及,互聯(lián)網成為民眾獲取信息的重要來源,同時也成為人們傳播信息和表達觀點的重要渠道。通過網絡了解社情民意,關注輿情動向,對于促進社會和諧穩(wěn)定、推動社會民主與法制建設具有重要的現(xiàn)實意義。
網絡信息浩如煙海,魚龍混雜,人工識別和研判顯得力不從心。如何利用計算機網絡技術、人工智能技術和數據挖掘技術,對網絡輿情信息有效地挖掘和分析成為了一個新的研究熱點。如何識別民眾所關注的熱點話題并有效地分類,如何
2、判斷民眾對社會事件的態(tài)度是正向的還是反向的,如何分析和把握社會熱點事件的波動性等,是網絡輿情研究中的亟需解決的重點問題,對認識和引導網絡輿情具有重要的科學意義。
本文針對網絡輿情信息的挖掘和分析中存在的問題展開研究,將基于Web的文本分類技術、機器學習算法研究、波動性的統(tǒng)計分析等技術應用到網絡突發(fā)事件的分類、網絡輿情信息的情感傾向性分析、輿情演變的波動性分析等研究中。主要的研究內容和創(chuàng)新點包括:
1.本文提出
3、將Fisher判別準則應用到網絡輿情文本的分類問題中,并實現(xiàn)對突發(fā)事件的分類。由突發(fā)事件引發(fā)的網絡輿情信息,從內容形式來看主要為文本,因此輿情信息的分類本質上是文本分類的問題。Fisher判別準則是解決降維問題的有效方法之一,但在文本分類中研究較少。本文將Fisher判別準則作為分類的特征提取的方法應用于文本分類,并應用于網絡突發(fā)事件新聞報道的分類。針對輿情的相關研究,將突發(fā)事件按照公共安全的四類,即突發(fā)自然災害、事故災難、公共衛(wèi)生事件
4、和社會安全事件進行分類。實驗證明,F(xiàn)isher準則的方法略遜于信息增益,但比較其他特征選擇方法都更好。
2.本文提出基于類別相關度的局部潛在語義分析的算法LR-LSA,改進了局部潛在語義分析算法進行文本分類。分析介紹了潛在語義分析的原理,包括奇異值分解和計算文檔間相似關系的方法。通過分析潛在語義分析方法的局限性,提出算法LR*LSA,先利用SVM分類器給每篇文檔一個類別相關度,然后根據相關度的大小選擇生成局部區(qū)域的方法。在
5、中文Web文本語料的兩組分類實驗中,驗證了算法LR-LSA比LSA和LC-LSA更有效。
3.針對機器學習方法在情感傾向性分析中對情感語義信息考慮不足的問題,本文提出了將情感模式和機器學習相結合的方法PMML,并應用于Web評論文本的情感傾向性分類。介紹了情感傾向性分析的相關研究,包括不同粒度級的基于情感詞典分析的分類方法,以及基于機器學習的情感傾向性分類方法。利用本文提出的方法PMML對Web評論文本分類,在對原始語料文
6、本進行基本的分詞之后,先進行關鍵詞提取,再進行模式匹配來提取情感評價短語,匹配成功后形成相應的情感特征序列,分別計算每個特征的情感傾向值,再通過機器學習的方法最終得到文本的情感傾向。實驗驗證了PMML方法較之機器學習的方法在分類效果上的有效性。
4.本文提出基于GARCH類模型的網絡輿情信息演變的波動性研究方法。在熱點事件的傳播過程中,波動性是其重要特征之一,強烈的波動往往意味著信息內容的不斷傳播和各種流言的不斷蔓延,存在
7、轉變?yōu)橥话l(fā)事件的可能性。通過分析網絡輿情演變過程中的波動性的特點,如變化率序列呈現(xiàn)的異方差性、尖鋒厚尾性等,對比金融領域的波動性,本文提出基于GARCH類模型的波動性研究方法。通過熱點事件在主流搜索引擎中采集到的Web頁面數,定量地分析與這個事件相關的輿情演變趨勢。選擇社會熱點事件“溫州動車事故”,通過收集數據,分析變化率,分別建立了GARCH,EGARCH,TARCH模型。實證分析了說明GARCH類模型對輿情演變的波動性分析的可行性。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于統(tǒng)計分析的微陣列數據挖掘技術.pdf
- 基于OLAP的網絡統(tǒng)計分析系統(tǒng)及關鍵技術研究.pdf
- 基于統(tǒng)計分析的隱蔽通信對抗技術研究.pdf
- 基于統(tǒng)計分析的數字水印檢測技術研究.pdf
- 網站流量統(tǒng)計分析技術研究.pdf
- 基于WebGIS的投訴統(tǒng)計分析技術研究與應用.pdf
- 基于網絡語義挖掘的輿情監(jiān)測預警研究.pdf
- 加工誤差統(tǒng)計分析與實現(xiàn)技術研究.pdf
- 基于聚類分析的網絡論壇輿情信息挖掘技術研究
- 61162.基于統(tǒng)計分析方法的人口地理信息數據挖掘技術研究
- 28443.基于多元統(tǒng)計分析的社團挖掘算法研究
- 基于AMR的中文句子語義標注及統(tǒng)計分析.pdf
- 抗統(tǒng)計分析的圖像密寫技術研究.pdf
- 概率型網絡的統(tǒng)計分析.pdf
- 統(tǒng)計分析與數據挖掘的對比分析.pdf
- 基于聚類分析的網絡論壇輿情信息挖掘技術研究.pdf
- 基于反饋控制與統(tǒng)計分析的結構損傷識別技術研究.pdf
- 統(tǒng)計分析
- 統(tǒng)計分析
- 基于統(tǒng)計分析的網絡流量特征測試.pdf
評論
0/150
提交評論