

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、近年來,數(shù)據(jù)流作為一種普遍存在的數(shù)據(jù)形式,吸引了越來越多數(shù)據(jù)挖掘研究者的關注,快速有效地針對數(shù)據(jù)流的一遍掃描式數(shù)據(jù)挖掘算法給人們提供日漸豐富的有價值信息,幫助提供決策支持,然而,數(shù)據(jù)流挖掘技術的飛速發(fā)展,也不可避免的給數(shù)據(jù)隱私和信息安全帶來了威脅。敏感信息有時可能就是原始數(shù)據(jù)或數(shù)據(jù)挖掘所發(fā)現(xiàn)的知識本身,或者可能通過數(shù)據(jù)挖掘知識中的非敏感信息被推理得到。面向信息共享的數(shù)據(jù)流隱私保護方法研究,不僅可以在數(shù)據(jù)流環(huán)境下,實現(xiàn)對敏感信息的保護,消
2、除信息擁有者共享信息時的擔憂,從而營造更加安全、開放的信息共享環(huán)境;而且在保護敏感信息的同時,充分考慮對非敏感信息完整性的影響,最大程度的降低隱私保護方法給非敏感信息所帶來的信息損失,從而使得被共享的信息保持較高的價值及有用性。
本文立足于實現(xiàn)數(shù)據(jù)流環(huán)境下安全的信息共享,在保證共享信息高可用性的前提下,對原始數(shù)據(jù)流以及關聯(lián)規(guī)則挖掘知識的隱私保護技術進行更加細致有效的研究:
首先,針對傳統(tǒng)的k-匿名方法無法表現(xiàn)數(shù)據(jù)流的
3、特征以及無法動態(tài)解決數(shù)據(jù)流共享時所存在的鏈接攻擊問題,提出自上而下具體化樹結構來完成多數(shù)據(jù)類型的準標識符屬性的泛化,通過樹的分支及剪枝動態(tài)實現(xiàn)數(shù)據(jù)流的k-匿名保護;同時,針對數(shù)據(jù)流匿名保護往往伴隨較高信息損失的問題,引入數(shù)據(jù)的分布密度以及延遲共享兩個限制參數(shù),并以此來選擇滿足k-匿名且產生信息損失最小的樹節(jié)點進行共享;在此基礎上,結合滑動窗口技術,提出數(shù)據(jù)流k-匿名保護算法(KIDS);最后,通過實驗表明:與傳統(tǒng)的k-匿名方法相比,KI
4、DS算法在匿名數(shù)據(jù)流時不僅所產生的時間代價更小,而且KIDS在不同的k參數(shù)和不同的數(shù)據(jù)量下所產生的信息損失也更小,能夠很好的保持共享原始數(shù)據(jù)流的高可用性。
其次,針對靜態(tài)數(shù)據(jù)的敏感規(guī)則隱藏方法應用于數(shù)據(jù)流時無法保持敏感規(guī)則安全性的問題,提出一種基于改進項頭表的頻繁模式樹(IMFP-Tree),并以此為基礎,提出面向數(shù)據(jù)流的敏感關聯(lián)規(guī)則隱藏算法(HSRDS)?;诟倪M的頻繁項頭表來解決傳統(tǒng)頻繁模式樹(FP-Tree)需要不斷統(tǒng)計
5、項的支持度計數(shù)而不適用于數(shù)據(jù)流的問題,并增加節(jié)點域ListTi來解決傳統(tǒng)頻繁模式樹因無法表示交易數(shù)據(jù)與項的包含關系,而很難快速確定敏感交易的問題;另外,定義了兩個信息損失度量閾值來選擇被清洗的數(shù)據(jù)項,解決數(shù)據(jù)清洗技術帶來的高信息損失問題;最后,通過實驗表明:IMFP-Tree相較于傳統(tǒng)的頻繁模式樹FP-Tree可以更快的完成數(shù)據(jù)流清洗,并且,與算法Algo2a和SWA相比,算法HSRDS會產生更小的負面效應,能夠有效的保持敏感規(guī)則隱藏與
6、數(shù)據(jù)有用性之間的平衡。
再次,針對數(shù)據(jù)流共享時,數(shù)據(jù)清洗方法實現(xiàn)敏感規(guī)則隱藏后,被隱藏的敏感規(guī)則仍然面臨隔離攻擊問題,提出了一種被隱藏敏感規(guī)則的k-匿名保護方法(SRA),完成對敏感規(guī)則的雙重保護;同時,針對現(xiàn)有的規(guī)則匿名方法需要二次清洗數(shù)據(jù)不適用數(shù)據(jù)流的問題,結合了時間滑動窗口技術,采用追加交易的流數(shù)據(jù)處理方式;并且,提出對數(shù)據(jù)項采用素數(shù)編碼的方法,進一步提高算法效率、降低空間復雜度;針對SRA算法在k值偏高時產生過高信息損
7、失的問題,提出改進的敏感規(guī)則k-匿名算法(ASRA);最后,通過實驗表明:與算法ARH相比,算法SRA和ASRA產生更小的時間代價以及更低的信息損失,當數(shù)據(jù)量增大時尤其如此。同時,算法ASRA相比于SRA產生的信息損失更低,能夠更好地保證挖掘結果的高有用性。
最后,針對數(shù)據(jù)流環(huán)境下被共享的關聯(lián)規(guī)則間所存在的相關性易對敏感規(guī)則造成推理攻擊威脅,基于規(guī)則凈化的思路,提出一種快速有效的、最小化信息損失的敏感規(guī)則推理攻擊阻塞算法(BI
8、A)。由于現(xiàn)有的頻繁模式推理通道不足以定義關聯(lián)規(guī)則的所有推理攻擊,通過分析關聯(lián)規(guī)則的推理特征,定義了四種可能存在的敏感規(guī)則的推理攻擊渠道:分解式推理攻擊、聚合式推理攻擊、傳遞式推理攻擊、鏈式推理攻擊;并且,針對基于頻繁模式的推理攻擊阻塞方法會對非敏感規(guī)則產生較高的信息損失問題,提出基于關聯(lián)規(guī)則的推理攻擊渠道的阻塞方法;最后,通過實驗表明:算法BIA不僅能更加全面的阻塞敏感規(guī)則的推理攻擊渠道,比算法DSA和BINFCH更適合數(shù)據(jù)流環(huán)境,并
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向共享的數(shù)據(jù)隱私保護匿名方法研究.pdf
- 事務型數(shù)據(jù)流發(fā)布的隱私保護方法研究.pdf
- 面向數(shù)據(jù)流的差分隱私直方圖發(fā)布.pdf
- 數(shù)據(jù)共享中隱私保護方法研究.pdf
- 面向實時數(shù)據(jù)流的匿名化隱私保護發(fā)布技術研究.pdf
- 一種面向隱私保護的分布式數(shù)據(jù)流挖掘算法.pdf
- 面向動態(tài)數(shù)據(jù)流的分類方法研究.pdf
- 面向數(shù)據(jù)挖掘的隱私保護方法研究.pdf
- 面向數(shù)據(jù)發(fā)布的隱私保護方法研究.pdf
- 云環(huán)境下基于動態(tài)數(shù)據(jù)流跟蹤的用戶隱私數(shù)據(jù)保護研究.pdf
- 基于控制流與數(shù)據(jù)流的面向方面測試方法研究.pdf
- 面向聚類分析的數(shù)據(jù)隱私保護方法研究.pdf
- 數(shù)據(jù)挖掘環(huán)境中隱私保護數(shù)據(jù)共享混合方法研究.pdf
- 面向協(xié)議數(shù)據(jù)流的數(shù)據(jù)抽取研究.pdf
- 面向類不均衡數(shù)據(jù)流的分類方法研究.pdf
- 面向數(shù)據(jù)挖掘的隱私保護方法研究與應用.pdf
- 面向Storm的數(shù)據(jù)流編程模型與優(yōu)化方法研究.pdf
- 面向數(shù)據(jù)流的數(shù)據(jù)聚類算法研究.pdf
- 面向分類分析的數(shù)據(jù)發(fā)布隱私保護方法研究.pdf
- 面向分布式的數(shù)據(jù)挖掘隱私保護方法研究.pdf
評論
0/150
提交評論