

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、<p><b> 應(yīng)用回歸分析</b></p><p><b> 課程設(shè)計報告</b></p><p> 課 程: 應(yīng)用回歸分析 </p><p> 題 目: 人均可支配收入的分析 </p><p> 年 級: 11金統(tǒng) &l
2、t;/p><p> 專 業(yè): 金融統(tǒng)計 </p><p> 學(xué) 號: </p><p> 姓 名: </p><p> 指導(dǎo)教師: </p><p> 基于多元線性回歸模型對我國城鎮(zhèn)居民家庭人均可支配收入的分析</
3、p><p> 摘要:收入分配和消費結(jié)構(gòu)都是國民經(jīng)濟(jì)的重要課題居民消費的主要來源是居民收入而消費又是拉動經(jīng)濟(jì)增長的重要因素。本文將通過多遠(yuǎn)統(tǒng)計分析方法對我國各地區(qū)城鎮(zhèn)居民收入的現(xiàn)狀進(jìn)行分析。通過分析找出我國城鎮(zhèn)居民收入特點及其中存在的不足。城鎮(zhèn)居民可支配收入是檢驗我國社會主義現(xiàn)代化進(jìn)程的一個標(biāo)準(zhǔn)。本文根據(jù)我國城鎮(zhèn)居民家庭人均可支配收入為研究對象,選取可能影響我國城鎮(zhèn)居民家庭人均可支配收入的城鄉(xiāng)居民儲蓄存款年底余額、城
4、鄉(xiāng)居民儲蓄存款年增加額、國民總收入、職工基本就業(yè)情況、城鎮(zhèn)居民家庭恩格爾系數(shù)(%)5個因素,運用多元線性回歸分析建立模型,先運用普通最小二乘估計求回歸系數(shù)再對方程進(jìn)行異方差、自相關(guān)、和多重共線性診斷,用迭代法消除了自變量之間的自相關(guān)。對于多重共線性問題,先是用逐步回歸和剔除變量的方法,最終轉(zhuǎn)變?yōu)橛梅讲顢U(kuò)大因子法城鄉(xiāng)居民儲蓄存款年增加額剔除城鎮(zhèn)居民家庭恩格爾系數(shù)(%)解決多重共線性,建立最終回歸方程</p><p>
5、;<b> 標(biāo)準(zhǔn)化回歸方程</b></p><p> 以其探究最后進(jìn)入回歸方程的幾個變量在影響城鎮(zhèn)居民收入孰輕孰重,達(dá)到學(xué)習(xí)與生活結(jié)合的效果。分析出影響城鎮(zhèn)居民收入的主要原因,并對模型聯(lián)系實際進(jìn)行分析,以供國家進(jìn)行決策做參考。</p><p> 關(guān)鍵詞:多元線性回歸 異方差 自相關(guān) 多重共線性 逐步回歸 方差擴(kuò)大因子</p><p&
6、gt;<b> ?。ㄒ唬┮裕?lt;/b></p><p> 改革開放以來我國的國民經(jīng)濟(jì)增長迅速居民的收入水平也大幅提高但居民收入分配差距也在不斷擴(kuò)大。2008年的金融危機(jī)為我國帶來的后遺癥還在繼續(xù)影響著居民正常生活物價上漲和通貨膨脹的壓力仍然困擾著老百姓收入和消費支出體系的健康發(fā)展至關(guān)重要。消費是拉動國民經(jīng)濟(jì)增長的一架重要馬車收入又是決定居民消費的最主要因素。我國人口基數(shù)大消費群體眾多但由于
7、居民收入分配差距大直接影響到居民消費需求的降低從而影響經(jīng)濟(jì)增長。而且隨著中國特色的市場經(jīng)濟(jì)體制的建立各種收入分配問題也愈發(fā)明顯。因此鑒于篇幅限制本文就只針對城鎮(zhèn)居民的收入進(jìn)行分析。中國網(wǎng)北京7月13日訊 國家統(tǒng)計局今日發(fā)布數(shù)據(jù)顯示,我國城鄉(xiāng)居民收入穩(wěn)定增長,農(nóng)村居民收入增長較快。上半年,城鎮(zhèn)居民家庭人均總收入12076元。其中,城鎮(zhèn)居民人均可支配收入11041元,同比增長13.2%,扣除價格因素,實際增長7.6%。在城鎮(zhèn)居民家庭人均總收
8、入中,工資性收入同比名義增長11.5%,轉(zhuǎn)移性收入增長9.9%,經(jīng)營凈收入增長31.2%,財產(chǎn)性收入增長20.4%。農(nóng)村居民人均現(xiàn)金收入3706元,同比增長20.4%,扣除價格因素,實際增長13.7%。其中,工資性收入同比名義</p><p> 下面通過統(tǒng)計數(shù)據(jù)對我國城鎮(zhèn)居民家庭人均可支配收入的總體現(xiàn)狀和發(fā)展態(tài)勢進(jìn)行分析了解我國居民收入分配情況。</p><p><b> 問
9、題重述</b></p><p> 以1991年-2011年的城鎮(zhèn)居民家庭人均可支配收入y為因變量,選取城鄉(xiāng)居民儲蓄存款年底余額x1、城鄉(xiāng)居民儲蓄存款年增加額x2、國民總收入x3、職工基本就業(yè)情況x4、城鎮(zhèn)居民家庭恩格爾系數(shù)(%)x5為自變量。</p><p> ?。ㄈ┠P头治雠c建立</p><p><b> ?、俣嘣€性回歸模型</b
10、></p><p> 多元線性回歸模型的一般形式 </p><p> 設(shè)隨機(jī)變量與一般變量 的線性回歸模型為 </p><p> ?。?.1) </p><p> 其中,是個未知參數(shù),稱為回歸常數(shù),稱為回歸系數(shù)。稱為被解釋變量(因變量),是個可以精確測量并控制的一般變量,稱為解釋變量(自變量)。 是隨機(jī)
11、誤差,與一元線性回歸一樣,對隨機(jī)誤差項我們常假定</p><p><b> ?。?.2)</b></p><p><b> 稱</b></p><p><b> (4.3)</b></p><p><b> 為理論回歸方程。</b></p>
12、;<p> 對一個實際問題,如果我們獲得組觀測數(shù)據(jù),則線性回歸模型(4.1)式可表示為</p><p><b> ?。?.4)</b></p><p><b> 寫成矩陣形式為</b></p><p><b> (4.5)</b></p><p><b
13、> 其中</b></p><p><b> (4.6)</b></p><p> 是一個階矩陣,稱為回歸設(shè)計矩陣或資料矩陣。</p><p> 多元線性回歸模型的基本假定</p><p> 為了方便地進(jìn)行模型的參數(shù)估計,對回歸方程(4.4)式有如下一些基本假定:</p><
14、p> 解釋變量是確定性變量,不是隨機(jī)變量,且要求。這里的,表明設(shè)計矩陣中的自變量列之間不相關(guān),樣本量的個數(shù)應(yīng)大于解釋變量的個數(shù),是一滿秩矩陣。</p><p> 隨機(jī)誤差項具有零均值和等方差,即</p><p><b> (4.7)</b></p><p> 這個假定常稱為高斯—馬爾柯夫條件。,假設(shè)觀測值沒有系統(tǒng)錯誤,隨機(jī)誤差項的
15、平均值為0。隨機(jī)誤差項的協(xié)方差為0,表明隨機(jī)誤差項在不同的樣本點之間是不相關(guān)的(在正態(tài)假定下即為獨立的),不存在序列相關(guān),并且有相同的精度。</p><p> ?。?)正態(tài)分布的假定條件為</p><p><b> ?。?.8)</b></p><p> 對于多元線性回歸的矩陣模型(4.5)式, 這個條件便可表示為</p>&l
16、t;p><b> ?。?.9)</b></p><p> 由上述假定和多元正態(tài)分布的性質(zhì)可知,隨機(jī)變量服從維正態(tài)分布,回歸模型(4.5)式的期望向量</p><p><b> ?。?.10) </b></p><p><b> ?。?.11)</b></p><p>
17、 因此 (4.12)</p><p> ?、诨貧w參數(shù)的普通最小二乘估計</p><p> 線性回歸方程確定后的任務(wù)是利用已經(jīng)收集到的樣本數(shù)據(jù),根據(jù)一定的統(tǒng)計擬合準(zhǔn)則,對方程中的各個參數(shù)進(jìn)行估計。普通最小二乘就是一種最為常見的統(tǒng)計擬合準(zhǔn)則,在該準(zhǔn)則下得到的回歸參數(shù)的估計稱為回歸參數(shù)的普通最小二乘估計。<
18、;/p><p> 對于(4.5)式表示的回歸模型,所謂最小二乘法,就是尋找參數(shù)的估計值,使離差平方和達(dá)到極小,即尋找滿足</p><p> ?。?.13) </p><p> 依照(4.13)式求出的就稱為回歸參數(shù)的最小二乘估
19、計。 </p><p><b> ?。?.14)</b></p><p><b> 為經(jīng)驗回歸方程。</b></p><p><b> 問題分析</b></p><p><b> ?、贁?shù)據(jù)說明</b></p><p> 以1
20、991年-2011年的城鎮(zhèn)居民家庭人均可支配收入y為因變量,選取城鄉(xiāng)居民儲蓄存款年底余額x1、城鄉(xiāng)居民儲蓄存款年增加額x2、國民總收入x3、職工基本就業(yè)情況x4、城鎮(zhèn)居民家庭恩格爾系數(shù)(%)x5為自變量。數(shù)據(jù)來源國家統(tǒng)計局網(wǎng)站統(tǒng)計年鑒。</p><p><b> ?、谇蠼夥治?lt;/b></p><p><b> 直接進(jìn)入法</b></p&g
21、t;<p> 可以看出調(diào)整后的決定系數(shù),說明回歸方程的擬合優(yōu)度比較好。</p><p> 方差分析表可以看出,F(xiàn)檢驗的檢驗值F=2990.552非常大,再看F檢驗的P值0.000,可知此回歸方程高度顯著,即做出5個自變量整體對因變量y產(chǎn)生顯著線性影響的判斷所犯錯誤的概率僅為0.000。</p><p> 此時得到的回歸方程為:</p><p>
22、 復(fù)決定系數(shù)為0.999,F(xiàn)-檢驗高度顯著(F=2990.552,P=0.000),說明模型整體擬合效果不錯。</p><p> 首先看t檢驗結(jié)果, 的t統(tǒng)計量及其相應(yīng)的值就是上表第五列(Sig.)的結(jié)果。我們可以發(fā)現(xiàn)顯著性水平時只有國民總收入()和就業(yè)情況()通過了顯著性檢驗。盡管回歸方程的顯著性檢驗高度顯著,但也會出現(xiàn)有某些自變量(甚至每個)對無顯著影響的情況。</p><p>
23、接著看看回歸系數(shù)的置信區(qū)間除了有國民總收入()系數(shù)95%置信區(qū)間[0.025,0.047]和就業(yè)情況()系數(shù)95%置信區(qū)間[0.057,0.147]不包含0,這也反映了回歸系數(shù)的不合理。</p><p> 那么究竟是什么原因?qū)е禄貧w方程出現(xiàn)上述結(jié)果呢,我們猜想可能是下列原因?qū)е碌摹?lt;/p><p><b> 異方差和自相關(guān)</b></p><p
24、> 在回歸模型的基本假設(shè)中,假定隨機(jī)誤差性具有相同的方差,獨立或不相關(guān),即對于所有樣本點,有</p><p> 但在建立實際問題的回歸模型時,經(jīng)常存在于此假設(shè)相違背的情況,一種是計量經(jīng)濟(jì)建模中常說的異方差性,即,當(dāng)時另一種是自相關(guān)性,即</p><p> ,當(dāng)時,異方差帶來的問題:</p><p> 當(dāng)一個回歸問題存在異方差時,如果仍用普通最小二乘發(fā)估
25、計位置參數(shù),將引起不良后果,特別是最小二乘估計量不再具有最小方差的優(yōu)良性,即最小二乘估計的有效性被破壞了。</p><p> 當(dāng)存在異方差時,參數(shù)向量的方差大于在同方差條件下的方差,如果用普通最小二乘發(fā)估計參數(shù),將出現(xiàn)低估的真是方差的情況,進(jìn)一步將導(dǎo)致高估回歸系數(shù)的t檢驗值,可能造成本來不顯著的某些回歸系數(shù)變成顯著。這將給回歸方程的應(yīng)用效果帶來一定影響。</p><p> 當(dāng)存在異方差
26、是,普通最小二乘估計存在以下問題:</p><p> 參數(shù)估計值雖然是無偏的,但不是最小方差線性無偏估計。</p><p> 參數(shù)的顯著性檢驗失效。</p><p> 回歸方程的應(yīng)用效果極不理想。</p><p><b> 自相關(guān)帶來的問題:</b></p><p> 當(dāng)一個線性回歸模型
27、的隨機(jī)誤差項存在序列相關(guān)時,就違背了線性回歸方程的基本假設(shè),如果仍然直接用普通最小二乘法估計未知參數(shù),將會產(chǎn)生嚴(yán)重后果,一般情況下,序列自相關(guān)性會帶來下列問題:</p><p> 1、最小二乘估計量仍然是線性的和無偏的。</p><p> 2、最小二乘估計量不是有效的,即OLS估計量的方差不是最小的,估計量不是最優(yōu)線性無偏估計量(BLUE)。</p><p>
28、 3、OLS估計量的方差是有偏的。用來計算方差和OLS估計量標(biāo)準(zhǔn)誤的公式會嚴(yán)重的低估真實的方差和標(biāo)準(zhǔn)誤,從而導(dǎo)致t值變大,使得某個系數(shù)表面上顯著不為零,但事實卻相反。</p><p> 4、t檢驗和F檢驗不是可信的。</p><p> 5、計算得到的誤差方差=(殘差平方和/自由度)是真實的有偏估計量,并且很可能低估了真實的。</p><p> 6、計算的也不能
29、真實的反映實際。</p><p> 7、計算的預(yù)測方差和標(biāo)準(zhǔn)誤差通常是無效的。</p><p><b> (2)多重共線性</b></p><p> 多元線性回歸有一個基本假設(shè),就是要求設(shè)計矩陣X的秩,即要求中的列向量之間線性無關(guān)。如果存在不全為零的個數(shù),使得</p><p><b> ?。?.1)<
30、;/b></p><p> 則自變量之間存在完全多重共線性。在實際問題中,完全的多重共線性并不多見,常見的是(5.1)式近似成立的情況,即存在不全為零的個數(shù),使得</p><p><b> (5.2)</b></p><p> 當(dāng)自變量存在(5.2)式的關(guān)系時,稱自變量之間存在多重共線性(multi-collinearity),也稱
31、為復(fù)共線性。</p><p> 多重共線性到來的影響:</p><p> 完全共線性下參數(shù)估計量不存在 </p><p> 近似共線性下OLS估計量非有效,多重共線性使參數(shù)估計值的方差增大,為方差擴(kuò)大因子(Variance Inflation Factor, VIF) </p><p> 參數(shù)估計量經(jīng)濟(jì)含義不合理 </p&
32、gt;<p> 變量的顯著性檢驗失去意義,可能將重要的解釋變量排除在模型之外 </p><p> 模型的預(yù)測功能失效。變大的方差容易使區(qū)間預(yù)測的“區(qū)間”變大,使預(yù)測失去意義。方程的異方差、自相關(guān)以及多重共線性診斷</p><p><b> 1.異方差診斷</b></p><p> 這里使用等級相關(guān)系數(shù)法檢驗,計算殘差絕對
33、值(見附錄2)與自變量的相關(guān)性時采用Spearman等級相關(guān)系數(shù),而不采用Pearson簡單相關(guān)系數(shù),這是由于等級相關(guān)系數(shù)可以反映非線性相關(guān)的情況,而簡單相關(guān)系數(shù)不能如實反映非線性相關(guān)情況。</p><p> 殘差絕對值與自變量儲蓄存款年底余額的相關(guān)系數(shù)為=0.023</p><p> 殘差絕對值與自變量儲蓄存款年增加額的相關(guān)系數(shù)為=0.121</p><p>
34、 殘差絕對值與自變量國民總收入的相關(guān)系數(shù)為=0.047</p><p> 殘差絕對值與自變量就業(yè)情況的相關(guān)系數(shù)為=-0.281</p><p> 殘差絕對值與自變量家庭恩格爾系數(shù)的相關(guān)系數(shù)為=-0.183</p><p> 因為在顯著性水平下,每個值都大于,認(rèn)為殘差絕對值與自變量不顯著相關(guān),即認(rèn)為不存在異方差。</p><p><
35、;b> 2.自相關(guān)診斷</b></p><p> 這里我們采用DW檢驗。可以用SPSS算出的值,結(jié)果如下</p><p> 由表5我們可以得到DW=1.892,查DW表,n=21,k=6,顯著性水平,得。由,可知殘差是有自相關(guān)。</p><p><b> 消除自相關(guān)</b></p><p>
36、這里我們用迭代法消除自相關(guān),需要求出和,其中</p><p><b> ?。?.3)</b></p><p> (5.3)式中自相關(guān)系數(shù)是未知的,用來估計,計算出后,帶入(5.3)式,計算變換因變量和變換自變量(見附錄1),然后用變換得到自變量和因變量作普通最小二乘回歸,看看自相關(guān)是否消除。</p><p> 由表6我們可以得到DW=1.7
37、82,查DW表,n=20,k=6,顯著性水平,得。由,可知不能判定殘差是否有自相關(guān)。</p><p><b> 多重共線性診斷</b></p><p> 這里采用方差擴(kuò)大因子和條件數(shù)檢驗回歸方程的多重共線性。方差擴(kuò)大因子法中,當(dāng)時,就說明自變量與其與自變量之間有嚴(yán)重的多重共線性,且這種多重共線性可能會過度地影響最小二乘估計。條件數(shù)法中,當(dāng)時,沒有多重共線性;時,存
38、在較強(qiáng)的多重共線性;時,存在嚴(yán)重的多重共線性</p><p> 可以看出儲蓄存款年底余額()國民總收入()的方差擴(kuò)大因子很大,分別為,,,遠(yuǎn)遠(yuǎn)超過10,說回歸方程存在著嚴(yán)重的多重共線性。</p><p><b> 消除多重共線性</b></p><p> 變量之間的多重共線性比較嚴(yán)重,我們先用逐步回歸的方法剔除一些變量。用普通最小二乘回歸
39、對迭代法得到的數(shù)據(jù)進(jìn)行分析</p><p> 可以看出儲蓄存款年底余額()的方差擴(kuò)大因子最大,應(yīng)該剔除變元(),用y與剩下的自變量建立回歸方程,有關(guān)計算結(jié)果如下。</p><p> 可以看到方差擴(kuò)大因子,依然存在多重共線性。繼續(xù)剔除家庭恩格爾系數(shù)()</p><p><b> 結(jié)果如下:</b></p><p>
40、 可以看出所有的方差擴(kuò)大因子都小于10,回歸系數(shù)也都有合理的經(jīng)濟(jì)解釋,說明此回歸系數(shù)也都有合理的經(jīng)濟(jì)解釋,說明此回歸模型不存在強(qiáng)多重共線性,可以作為最終回歸模型?;貧w方程為</p><p><b> 標(biāo)準(zhǔn)化回歸方程</b></p><p><b> 模型優(yōu)劣分析</b></p><p><b> ?、倌P驮u價
41、</b></p><p><b> 優(yōu)點</b></p><p> 本文以多元線性回歸建立模型,分別選用了等級相關(guān)系數(shù)法診斷異方差;圖示檢驗法和DW檢驗法診斷自相關(guān)迭代法消除自相關(guān);方差和擴(kuò)大因子法診斷多重共線性方差擴(kuò)大因子法建立回歸方程。用多元線性回歸模型得到的回歸方程能很明白的說明問題,容易理解。</p><p><b
42、> 缺點</b></p><p> 為了解決多重共線性問題,選取的5個自變量未能全部進(jìn)入最后的回歸方程。</p><p><b> ②模型推廣</b></p><p> 本文建立的多元線性回歸模型很好地決絕了實際問題,并且能夠推廣應(yīng)用到現(xiàn)實生活中的很多問題,如:</p><p> 分析國家財政
43、收入與選取自變量之間的關(guān)系,并對其作出短期預(yù)測;</p><p> 分析股票變動與選取自變量之間的關(guān)系,并對其作出短期預(yù)測。</p><p><b> ?。﹨⒖嘉墨I(xiàn)</b></p><p> [1] 薛薇,《SPSS統(tǒng)計分析方法及應(yīng)用(第二版)》,北京:電子工業(yè)出版社,2009年</p><p> [2] 茆詩
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 關(guān)于城鎮(zhèn)居民人均可支配收入的分析
- 長沙市人均可支配收入的分析與預(yù)測.pdf
- 廣西城鎮(zhèn)居民人均可支配收入倍增計劃(節(jié)選)
- 人均可支配收入的區(qū)域差異分析——以溫州和蘇州為例.pdf
- 我國城鎮(zhèn)居民人均可支配收入對消費支出影響的實證研究
- 城鄉(xiāng)居民人均可支配收入增速與gdp增速關(guān)系探究
- 統(tǒng)計學(xué)專業(yè)實習(xí)論文-關(guān)于城鎮(zhèn)居民人均可支配收入的分析
- 我國城鎮(zhèn)居民人均可支配收入對消費支出影響的實證研究
- 浙江省城鎮(zhèn)居民人均可支配收入與消費的統(tǒng)計分析[開題報告]
- 云南省城鎮(zhèn)居民人均消費與人均可支配收入關(guān)系的實證研究.pdf
- 浙江省城鎮(zhèn)居民人均可支配收入與消費的統(tǒng)計分析[畢業(yè)論文]
- 浙江省城鎮(zhèn)居民人均可支配收入與消費的統(tǒng)計分析[文獻(xiàn)綜述]
- 1978-2015中國歷年gdp與城鎮(zhèn)居民人均可支配收入統(tǒng)計表
- 城鎮(zhèn)居民人均可支配收入與當(dāng)?shù)厣唐贩績r格的相關(guān)性研究畢業(yè)論文
- 浙江省城鎮(zhèn)居民人均可支配收入與消費的統(tǒng)計分析[畢業(yè)論文+開題報告+文獻(xiàn)綜述]
- 甘肅居民可支配收入與經(jīng)濟(jì)增長的關(guān)系
- 大學(xué)論文我國城鎮(zhèn)居民可支配收入預(yù)測分析
- 我國城鎮(zhèn)居民消費與可支配收入的實證分析
- 我國城鎮(zhèn)居民可支配收入與消費結(jié)構(gòu)的實證分析.pdf
- 我國城鎮(zhèn)居民可支配收入與消費結(jié)構(gòu)的實證分析
評論
0/150
提交評論