

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、3.13.1數據預處理內容數據預處理內容:數據審核(完整性和準確性;適用性和實效性),數據篩選和數據排序。3.23.2分類數據和順序數據的整理和圖示方法各有哪些分類數據和順序數據的整理和圖示方法各有哪些分類數據:制作頻數分布表,用比例,百分比,比率等進行描述性分析??捎脳l形圖,帕累托圖和餅圖進行圖示分析。順序數據:制作頻數分布表,用比例,百分比,比率。累計頻數和累計頻率等進行描述性分析。可用條形圖,帕累托圖和餅圖,累計頻數分布圖和環(huán)形圖
2、進行圖示分析。3.33.3數據型數據的分組方法和步驟數據型數據的分組方法和步驟分組方法:單變量值分組和組距分組,組距分組又分為等距分組和異距分組。分組步驟:1確定組數2確定各組組距3根據分組整理成頻數分布表3.43.4直方圖和條形圖的區(qū)別直方圖和條形圖的區(qū)別1條形圖使用圖形的長度表示各類別頻數的多少,其寬度固定,直方圖用面積表示各組頻數,矩形的高度表示每一組的頻數或頻率,寬度表示組距,2直方圖各矩形連續(xù)排列,條形圖分開排列,3條形圖主要
3、展示分類數據,直方圖主要展示數值型數據。3.53.5繪制線圖應注意問題繪制線圖應注意問題時間在橫軸,觀測值繪在縱軸。一般是長寬比例10:7的長方形,縱軸下端一般從0開始,數據與0距離過大的話用折斷符號折斷。3.63.6餅圖和環(huán)形圖的不同餅圖和環(huán)形圖的不同餅圖只能顯示一個樣本或總體各部分所占比例,環(huán)形圖可以同時繪制多個樣本或總體的數據系列,其圖形中間有個“空洞”,每個樣本或總體的數據系類為一個環(huán)。3.73.7莖葉圖比直方圖的優(yōu)勢,他們各自
4、的應用場合莖葉圖比直方圖的優(yōu)勢,他們各自的應用場合莖葉圖既能給出數據的分布情況,又能給出每一個原始數據,即保留了原始數據的信息。在應用方面,直方圖通常適用于大批量數據,莖葉圖適用于小批量數據。3.83.8鑒別圖標優(yōu)劣的準則鑒別圖標優(yōu)劣的準則1一張好圖應當精心設計,有助于洞察問題的實質。2一張好圖應當使復雜的觀點得到簡明、確切、高效的闡述。3一張好圖應當能在最短的時間內以最少的筆墨給讀者提供最大量的信息。4一張好圖應當是多維的。5一張好圖
5、應當表述數據的真實情況。3.93.9制作統計表應注意的問題制作統計表應注意的問題(1)合理安排統計表結構(2)表頭一般包括表號,總標題和表中數據的單位等內容(3)表中的上下兩條橫線一般用粗線,中間的其他用細線(4)在使用統計表時,必要時可在下方加注釋,注明數據來源。公式:組中值=(上限下限)26.16.1統計量統計量:設X1X2…Xn是從總體X中抽取的容量為n的一個樣本,如果由此樣本構造一個函數T(X1X2…Xn),不依賴于任何未知參數
6、,則稱函數T(X1X2…Xn)是一個統計量。原因:為了使統計推斷成為可能。6.26.2T1T1和T2T2是6.36.3次序統計量次序統計量:設X1,X2,…,Xn是從總體X中抽取的一個樣本,Xi稱為第i個次序統計量,它是樣本(X1,X2,…,Xn)滿足如下條件的函數:每當樣本得到一組觀測值X1,X2,…,Xn時,其由小到大的排序X1≤X2≤…≤Xi≤…≤Xn中,第i個值Xi就作為次序統計量Xi的觀測值,而X1,X2,…,Xn稱為次序統計
7、量?!啊?廢品率降低),建立的原假設與備擇假設應為H0:μ≥2%,H1:μ2%.)10.110.1什么是方差分析?它研究的是什么?什么是方差分析?它研究的是什么?答:方差分析就是通過檢驗各總體的均值是否相等來判斷分類型自變量對數值型因變量是否有顯著影響。它所研究的是非類型自變量對數值型因變量的影響。10.210.2要檢驗多個總體均值是否相等時,為什么不作兩兩比較,而用方差分析方要檢驗多個總體均值是否相等時,為什么不作兩兩比較,而用方差分
8、析方法?法?答:作兩兩比較十分繁瑣,進行檢驗的次數較多,隨著增加個體顯著性檢驗的次數,偶然因素導致差別的可能性也會增加。而方差分析方法則是同時考慮所有的樣本,因此排除了錯誤累積的概率,從而避免拒絕一個真實的原假設。10.310.3方差分析包括哪些類型?它們有何區(qū)別?方差分析包括哪些類型?它們有何區(qū)別?答:方差分析可分為單因素方差分析和雙因素方差分析。區(qū)別:單因素方差分析研究的是一個分類型自變量對一個數值型因變量的影響,而雙因素涉及兩個分
9、類型自變量。10.410.4方差分析中有哪些基本假定方差分析中有哪些基本假定?答:方差分析中有三個基本假定:(1)每個總體都應服從正態(tài)分布(2)各個總體的方差σ2必須相同(3)觀測值是獨立的10.510.5簡述方差分析的基本思想。簡述方差分析的基本思想。答:它是通過對數據誤差來源的分析來判斷不同總體的均值是否相等,進而分析自變量對因變量是否有顯著影響。10.610.6解釋因子與處理的含義。解釋因子與處理的含義。答:在方差分析中,所要檢驗
10、的對象稱為因素或因子,因素的不同表現稱為水平或處理。10.710.7解釋組內誤差和組間誤差的含義解釋組內誤差和組間誤差的含義。答:組內誤差(SSE)是指每個水平或組的個樣本數據與其組平均值誤差的平方和,反映了每個樣本各觀測值的離散狀況;組間誤差(SSA)是指各組平均值i與總平均值的誤差平方和,反映各樣本均值之間的差異程度。X10.810.8解釋組內方差和組間方差的含義解釋組內方差和組間方差的含義。答:組內方差指因素的同一水平(同一個總體
11、)下樣本數據的方差,組間方差指因素的不同水平(不同總體)下各樣本之間的方差。10.910.9簡述方差分析的基本步驟。簡述方差分析的基本步驟。答:(1)提出假設(一般提法形式如下:H0:μ1=μ2=μ3=…=μi=….μk,自變量對因變量沒有顯著影響H1:μi(i=123…..k)不全相等,自變量對因變量有顯著影響)(2)構造檢驗統計量(包括:計算各樣本的均值,計算全部觀測值的總均值,計算各誤差平方和,計算統計量)(3)統計決策。(將統計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論