

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、在調查或試驗中存在著大量的縱向數據,所謂縱向數據是指對每個個體在不同的時間點上測得的一系列數據。與橫向數據相比,縱向數據的一個主要優(yōu)勢在于它可以有效地估計個體內和個體間隨時間變化的趨勢??v向數據廣泛存在于如社會科學、醫(yī)學、藥物學、經濟學、農業(yè)和工業(yè)等領域中,因此研究縱向數據的統(tǒng)計分析有重要的意義。在縱向數據中,雖然不同個體間可視為是相互獨立的,但是同一個體的多次觀察數據間存在著不可忽視的相關性,恰當地處理這種相關性是做好統(tǒng)計
2、分析的關鍵。而混合效應模型提供了描述這種關系的一種有效方法,本文將圍繞這個主題展開討論,歸納起來,本論文的主要內容有:第一章綜述性地介紹了本文所涉及的概念、背景、文獻中相關模型和方法。關于縱向數據的一個重要研究方向是在較合理的模型假定下給出具有一定優(yōu)良性的估計。為此本章較為詳細的敘述了文獻中兩類相關且在實際中得到廣泛應用的模型:線性混合效應模型和變系數模型。同時本章還回顧了非參數回歸模型的局部光滑估計方法: Nadaray
3、a-Watson估計、Gasser-Miller估計和局部多項式估計方法;由于局部多項式方法相對于其它兩種方法存在著種種優(yōu)點,本論文將使用局部多項式方法給出未知函數的估計。第二章討論了如下形式的關于縱向數據的隨機截距模型:yij=ui+xτijβ+∈ij i=1,2,…,m;j=1,2,…,ni,其中ni為個體i的觀測次數,yij為個體i的第j次觀察值, xij∈rp為給定的協(xié)變量;β為總體未知參數;ui是iid.的隨機
4、效應,其期望和方差分別為Eu1=θ,Var(u1)=σ2u<∞;隨機誤差∈ij iid.滿足E∈11=0,E∈211=σ2∈<∞,且與ui獨立.這個模型也稱為誤差分量或方差分量模型(見Hsiao,1986),其主要目的是對θ,β,σ2u,σ2u,作出統(tǒng)計推斷.我們在對ui及∈ij沒有任何分布設定的情況下,建立了參數θ,β,σ2u,σ2∈的無偏估計顯式表示;并且在較一般的條件下給出了上述估計量的強相合性,方差分量估計的強收斂階
5、(達到了最優(yōu)的收斂速度)和β,σ2∈估計的漸近正態(tài)性.第三章討論了一般線性混合效應模型。Laird & Ware(1982)研究了如下的模型:(公式略)其中ni為個體i的觀察次數,Xi和Zi分別為個體間和個體內的已知設計矩陣,βp×1為總體參數,bi∈Rq是第i個個體的隨機效應向量,且bi iid.,與∈i獨立,∈ij為iid.期望為0,方差為σ2∈(0<σ2∈<∞)的隨機誤差.我們在不設定隨機效應和隨機誤差分布的情況下,
6、使用LS方法和殘差平方和分別給出了模型未知參數β,σ2∈估計及隨機效應bi預測的顯式表示,而且深入研究了這些估計量的大樣本性質,在設計點列及一定矩條件下證明了各估計量的強相合性和β估計的漸近正態(tài)性.第四章研究了一個新的模型一隨機截距變系數模型。Hastie & Tibshirani(1993)提出了如下一般形式的變系數模型:Y=X1β1(R1)+…+Xpβp(Rp)+∈其中Y為響應變量,X=(X1,…,Xp)T為解釋向量,
7、{βl(·),1≤l≤p}是一些未知函數,R1,…,Rp稱為效應改變(effect modifying)變量,即通過諸未知函數β1(·),…,βp(·)來改變X1,…,xp的系數, β(Rl)(l=1,…,p)暗含了Rl和Xl的一種特殊的相互聯(lián)系,∈是期望為0、方差為σ2∈的獨立于Xl,Rl的隨機誤差。注意到Rl可能互不相同,也可能相同,也可能是某個Xl。當R1,…,Rp取不同的協(xié)變量時,由于“維數禍根”(the curse
8、 of dimension)問題,上述模型在實際問題處理中有一定難度。有時,人們常常將R1,…,Rp取成相同的一元協(xié)變量,如時間(West,Harrison & Migon 1985,Hastie & Tibshirani 1987和Cleveland,Groose & Shyu 1991)。如將變系數模型看成是一般線性模型的一種有用的推廣(參見Shumway 1988,P.245),就存在著與線性模型相同的缺陷,即通常假定回
9、歸函數是非隨機的,因而不能很好地反映個體之間存在的差異.借鑒線性混合效應模型的處理,本章中我們提出了帶隨機截距項的變系數模型,即如下形式的模型:Y=u+XTβ(w)+∈其中u是隨機變量,反映了試驗的隨機效應,X∈Rp,w∈R為設計點列,β(w)=(β1(w),…,βp(w))T為未知函數系數,我們稱此模型為隨機截距變系數模型.若在此模型中,對所有的l=1,…,p,βl(·)=βl(βl為常數),則此模型就化為隨機截距模型(
10、radom intercept models);若u三0,則退化為變系數模型;顯見這一模型是更具靈活性的一個新模型.在縱向數據的隨機截距變系數模型中,我們使用局部多項式方法,給出了函數系數βl(·)(l=1,…,p)的估計。通過應用函數系數的估計建立了隨機效應方差σ2u及誤差方差σ2∈的估計。并探討了這些估計量的強相合性。兩個實例結果表明,這種新模型是合理的、有用的,相應的估計量是有效可行的。第五章進一步推廣了上一章中的隨機
11、截距變系數模型。提出了下述更一般的模型:Y=XTβ(w)+ZTb+∈其中Y∈R為響應變量;X∈Rp,Z∈Rq,w∈R為設計點列;β(w)=(β1(w),…,βp(w))T為未知函數系數;bi∈Rq為第i個個體的隨機效應向量,我們稱此模型為變系數混合效應模型.在縱向數據場合下,我們首先在假定隨機效應期望θ已知的情況下,利用局部多項式方法得到了函數系數β(·)的估計,通過應用函數系數的這一估計,給出了隨機效應期望θ的LS估計
12、,最后依次得到了β(·),σ2b,σ2∈的估計及bi的預測。并研究了這些估計量的強相合性及bi預測,θ估計的漸近正態(tài)性。模擬研究結果顯示,這種新模型是合理的,估計方法是較為理想的。由于充分挖掘了縱向數據所提供的豐富信息,我們在不設定隨機效應和誤差分布的條件下,成功建立了模型中未知量的顯式估計,較為全面地探討了相應估計量的大樣本性質;進一步,本論文提出了一類更具靈活性的新模型一變系數混合效應模型,不同于變系數模型的文獻,我們在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 帶有混合相關結構的縱向數據的統(tǒng)計分析.pdf
- 一類特殊縱向數據模型的統(tǒng)計分析.pdf
- 有限混合分布模型的統(tǒng)計分析.pdf
- 正交飽和效應模型的統(tǒng)計分析.pdf
- 基于縱向數據的混合效應模型分析.pdf
- 數據的統(tǒng)計分析
- 含右刪失數據的隨機效應模型的統(tǒng)計分析.pdf
- matlab數據的統(tǒng)計分析
- 混合分組數據下加速壽命試驗的統(tǒng)計分析.pdf
- 舍入數據的統(tǒng)計分析.pdf
- 混合Pareto分布的統(tǒng)計分析.pdf
- 污染數據的統(tǒng)計分析.pdf
- 縱向數據混合效應模型的研究.pdf
- 缺失數據半參數模型統(tǒng)計分析.pdf
- 臨床治療數據的統(tǒng)計分析
- 模糊數據的統(tǒng)計分析方法.pdf
- 大數據的統(tǒng)計分析方法
- 混合模型在臨床試驗統(tǒng)計分析中的應用.pdf
- 基于縱向數據的線性混合效應模型參數的Bayes統(tǒng)計推斷.pdf
- 房屋截面數據的統(tǒng)計分析.pdf
評論
0/150
提交評論