基于視頻的人體動作識別方法研究.pdf_第1頁
已閱讀1頁,還剩61頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于視頻的人體動作識別是計算機視覺領域的一個熱點問題,在智能監(jiān)控、人機交互以及視頻檢索等領域具有廣泛的應用前景和潛在的經濟價值。動作識別的主要任務是通過計算機對傳感器采集的原始圖像或圖像序列數(shù)據(jù)進行處理和分析,學習并理解其中人的動作和行為,建立底層視覺特征與動作行為類別等高層語義信息之間的對應關系。
   動作識別中主要解決的問題有兩個:動作表示和動作分類。動作表示即從視頻中提取有效的特征對動作進行描述,而動作分類則是根據(jù)提取的

2、特征設計相應的分類模型。根據(jù)對動作的表示的不同,我們將目前的動作識別方法分為三類:基于人體模型的方法,基于全局特征的方法,基于局部特征的方法。其中,基于局部特征的方法是近年來比較流行的方法,在多個人體動作數(shù)據(jù)集上都取得了很好的結果。
   視頻特征提取與描述是人體動作識別中至關重要的一步,對動作識別的結果有著重要的影響。本文首先對現(xiàn)存的軌跡提取方法進行了詳細的分析,指出了它們的創(chuàng)新與不足之處,然后提出了一種新的軌跡提取方法,它能

3、夠準確的反映出人的運動信息。為了描述一條給定軌跡的形狀和運動信息,我們在它的局部鄰域內抽取三種描述符:梯度方向直方圖,光流直方圖,運動邊界直方圖。
   很多情況下,識別人體動作不僅與人體的運動軌跡有關,也與人所處的場景有關,場景信息能夠暗示在這種情況下可能會發(fā)生的動作類型?;诖?,本文使用了一種場景特征Gist來對場景結構進行建模。
   我們引入了一種詞袋模型的思想,將視頻表示為一系列視覺單詞的集合,由于詞袋模型通常

4、忽略了局部特征之間的時空關系,我們將視頻序列劃分為時空網格以嵌入結構信息。最后,我們還使用了多核學習的思想,將兩類特征進行有效的融合,以達到最佳的分類效果。
   目前的動作識別算法在簡單受限的場景下得到了較高的識別率,然而,真實場景(比如電視廣播、電影以及監(jiān)控視頻等)中的動作識別仍舊是一個非常有挑戰(zhàn)性的問題。為了驗證本文算法的有效性和可行性,我們在四個具有挑戰(zhàn)性的人體動作數(shù)據(jù)集上對本文的算法進行了測試和評價。實驗結果表明:本文

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論