衛(wèi)生統(tǒng)計學(xué)復(fù)習(xí)20161225_第1頁
已閱讀1頁,還剩99頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、,,毛振興 博士鄭州大學(xué)公共衛(wèi)生學(xué)院18339970522zhenxingmao@qq.com,醫(yī)學(xué)統(tǒng)計學(xué)復(fù)習(xí),一、醫(yī)學(xué)統(tǒng)計的基本內(nèi)容,1. 統(tǒng)計學(xué):統(tǒng)計學(xué)是一門科學(xué)和藝術(shù),專門處理數(shù)據(jù)中的變異性。 如何處理:通過數(shù)據(jù)收集、整理、分析。 目的:得到可靠的結(jié)果。 2. 醫(yī)學(xué)統(tǒng)計學(xué):統(tǒng)計學(xué)應(yīng)用于醫(yī)藥衛(wèi)生領(lǐng)域即稱為醫(yī)學(xué)統(tǒng)計學(xué)。,3. 幾個基本概念: ⑴ 總體、樣本、個體、隨機抽樣、抽樣誤差 ⑵ 同質(zhì)、變異、

2、變量 ⑶ 參數(shù)、統(tǒng)計量 ⑷ 隨機事件、概率,4. 三種資料類型: 數(shù)值變量,即計量資料 無序分類變量,即計數(shù)資料 有序分類變量,即等級資料,5. 統(tǒng)計工作基本步驟: 統(tǒng)計設(shè)計:研究什么(總體樣本)、怎樣分組(隨機對照)、收集什么資料(指標要求)、怎樣統(tǒng)計分析(據(jù)分布選方法) 搜集資料:準確可靠及時、盲法設(shè)計 整理與分析資料:正確選用統(tǒng)計方法。,6.制作統(tǒng)計表和繪制統(tǒng)計圖的基本要求,常用統(tǒng)計表和統(tǒng)計圖的應(yīng)用

3、(選用)。,二、定量資料的統(tǒng)計分析,統(tǒng)計描述統(tǒng)計圖表概率分布抽樣誤差與參數(shù)估計假設(shè)檢驗基礎(chǔ)T檢驗,1.頻數(shù)表(直方圖)意義: ①較具體地、直觀地描述一組數(shù)據(jù)的特征和類型; ②有助于正確選用統(tǒng)計指標和便于計算; ③有助于發(fā)現(xiàn)異常值。,要點,2.各種反映平均水平和離散程度的指標的意義、正確應(yīng)(選)用、計算及適用條件(資料類型、分布)。 平均水平指標: 離散程度的指標:,要點,3.正態(tài)分布的圖形及其特征: 1)正

4、態(tài)曲線在橫軸上方,均數(shù)處最高。 2)正態(tài)分布以均數(shù)為中心,左右對稱。 均數(shù)、中位數(shù)及幾何均數(shù)相等。 3)正態(tài)分布有兩個參數(shù),μ和σ 。 μ是位置參數(shù),決定正態(tài)曲線的中心位置。σ是變異度參數(shù),決定正態(tài)曲線的陡峭或扁平程度。σ越大,曲線越陡峭,σ越小,曲線越扁平。 4)正態(tài)曲線下的面積分布有一定規(guī)律。,要點,4. 正態(tài)曲線下面積的分布規(guī)律: 曲線下總面積為1或100% 常用的區(qū)間及其面積有: ①均數(shù)

5、加減1.96倍標準差范圍外雙側(cè)尾部面積共5% ②均數(shù)加減2.58倍標準差范圍外雙側(cè)尾部面積共1%,要點,5.參考值范圍的制定及適用條件:(正態(tài)、對數(shù)正態(tài)、百分位數(shù)法) 6.均數(shù)的抽樣誤差與標準誤: 標準誤用來說明樣本均數(shù)的抽樣誤差大小。,要點,7.t分布: 若變量X~N(?,?2), 則樣本均數(shù) 據(jù)此可作標準正態(tài)變換: 在?未知情況下,只好用S作為其估計值,這時:,要點,t 的分布不同于標準正態(tài)分布,稱為t分布

6、。 其特征是:單峰,t分布曲線下面積分布規(guī)律隨自由度而變化(要查表)。 自由度,要點,8.總體均數(shù)的區(qū)間估計: 已知σ時, 未知σ時, 未知σ,n足夠大時,,要點,9.假設(shè)檢驗的基本步驟和基本思想,(1)建立假設(shè),確定檢驗水準(2)計算檢驗統(tǒng)計量(3)確定P值,下結(jié)論,要點,10.t檢驗:樣本與總體比較的t檢驗:配對設(shè)計t檢驗: 兩獨立

7、樣本t檢驗:,要點,學(xué)習(xí)目標了解頻數(shù)分布表的編制方法及應(yīng)用。掌握定量資料集中趨勢和離散趨勢常用的統(tǒng)計描述指標,及各自的應(yīng)用。,1.統(tǒng)計描述,1.頻數(shù)表(直方圖)意義: ①較具體地、直觀地描述一組數(shù)據(jù)的特征和類型; ②有助于正確選用統(tǒng)計指標和便于計算; ③有助于發(fā)現(xiàn)異常值。,,2.各種反映平均水平和離散程度的指標的意義、正確應(yīng)(選)用、計算及適用條件(資料類型、分布)。 平均水平指標: 離散程度的指標:,2.統(tǒng)計圖表,

8、定義:統(tǒng)計表是用表格的形式將統(tǒng)計分析的事物及其統(tǒng)計指標表達出來。 統(tǒng)計表的結(jié)構(gòu): 表號、標題、標目、線條、數(shù)字以及備注 統(tǒng)計表的種類: 簡單表(simple table):研究事物的主要內(nèi)容或?qū)ο笾挥幸粋€分組標志。 復(fù)合表(combinative table):研究事物的主要內(nèi)容或?qū)ο笥袃蓚€或兩個以上的分組標志。,表3-10 某高校不同年級AIDS傳播途徑知識得分情況,,橫標目,,數(shù)字,標題,表號,橫標目總名稱,

9、縱標目,線條,統(tǒng)計表的繪制原則,總原則:重點突出,簡單明了。不要包羅萬象,要使人看過后能明白表格所要表達的主要內(nèi)容。主謂分明,層次清楚。避免層次過多或結(jié)構(gòu)混亂。,統(tǒng)計圖,定義:統(tǒng)計圖(statistical chart):用點的位置、線段的升降、直條的長短,面積的大小直觀地描述某事物的特征,是重要的統(tǒng)計描述方法。 特點:直觀、醒目,常給人以深刻印象,但統(tǒng)計圖對數(shù)量的表達較粗略,只能作為統(tǒng)計表有益的補充。,圖3 正態(tài)分布的概率密

10、度函數(shù),利用分布函數(shù)F(X) 可以計算正態(tài)分布變量取值在任意區(qū)間(a,b)的概率為,概率密度Y軸的高度,面積,P(a≤X<b)=,3.概率分布,正態(tài)分布的圖形及其特征: 1)正態(tài)曲線在橫軸上方,均數(shù)處最高。 2)正態(tài)分布以均數(shù)為中心,左右對稱。 均數(shù)、中位數(shù)及幾何均數(shù)相等。 3)正態(tài)分布有兩個參數(shù),μ和σ 。 μ是位置參數(shù),決定正態(tài)曲線的中心位置。σ是變異度參數(shù),決定正態(tài)曲線的陡峭或扁平程度。σ越

11、大,曲線越陡峭,σ越小,曲線越扁平。 4)正態(tài)曲線下的面積分布有一定規(guī)律。,正態(tài)曲線下面積的分布規(guī)律: 曲線下總面積為1或100% 常用的區(qū)間及其面積有: ①均數(shù)加減1.96倍標準差范圍外雙側(cè)尾部面積共5% ②均數(shù)加減2.58倍標準差范圍外雙側(cè)尾部面積共1%,醫(yī)學(xué)參考值范圍,制定參考值范圍時:(1)確定一批樣本含量足夠大的“正常人”(2)選定適當?shù)陌俜纸缦蓿ㄈ?5%)(3)需根據(jù)專業(yè)知識確定單側(cè)或雙側(cè)界值(4)根

12、據(jù)資料分布特征選擇合適的方法,用于正態(tài)分布資料,可用于任何分布資料,但更常用于偏態(tài)分布資料,P 2.5-P 97.5,P 95,P 5,標準正態(tài)分布,,正態(tài)分布,標準正態(tài)分布,4.抽樣誤差與參數(shù)估計,數(shù)理統(tǒng)計研究表明,抽樣誤差具有一定的規(guī)律性,可以用特定的指標來描述。樣本均數(shù)的標準差(簡稱標準誤,standard error, SE)是描述均數(shù)的抽樣誤差大小的指標。,標準誤的概念,標準誤的理論值,標準誤的理論值的估計值,標準誤的計算,

13、,前提:無限總體完全隨機抽樣,1從正態(tài)分布資料中,隨機抽取例數(shù)n的樣本,其樣本均數(shù)也服從正態(tài)分布。,中心極限定理,X,(a) 原始數(shù)據(jù),,,,2 當n足夠大時(n大于30),從偏態(tài)總體中抽樣,其均數(shù)也近似正態(tài)分布。樣本均數(shù)呈正態(tài)分布,中心極限定理,,,,3根據(jù)數(shù)理統(tǒng)計學(xué)原理,若隨機變量X 的均數(shù)為 ,方差為 ,則樣本均數(shù)的均數(shù)仍為 ,樣本均數(shù)的標準差,即均數(shù)的標準誤為:,中心極限定理,標準誤和標準差的區(qū)別與聯(lián)系

14、,t分布: 若變量X~N(?,?2), 則樣本均數(shù) 據(jù)此可作標準正態(tài)變換: 在?未知情況下,只好用S作為其估計值,這時:,圖2 不同自由度的t分布曲線,1. t分布是一簇曲線。 t分布有一個參數(shù)? =(n-1)。2. t分布曲線以0為中心,左右對稱; ?越小,曲線越扁平。3. t分布曲線較標準正態(tài)曲線要扁平些, ?逐漸增大, t分布曲線逐漸的逼近于標準正態(tài)曲線,若?=?,則t分布曲線和標準正態(tài)曲線完全吻合。4.

15、 t分布曲線下的面積分布有一定規(guī)律(P380)。,t分布圖形的特點,參數(shù)估計:用樣本統(tǒng)計量來估計總體參數(shù)。點值估計:不計抽樣誤差,直接用樣本均數(shù)來估計μ。區(qū)間估計:根據(jù)抽樣誤差的規(guī)律,按一定的概率估計總體均數(shù)的所在范圍。統(tǒng)計上習(xí)慣用95%或99%可信區(qū)間表示總體均數(shù)可能所在范圍。,總體均數(shù)的95%置信區(qū)間: 已知σ時, 未知σ時, 未知σ,n足夠大時,,總體均數(shù)μ的區(qū)間估計:,,置信區(qū)間與醫(yī)學(xué)參考值范圍不同,5.假設(shè)檢驗

16、基礎(chǔ),1.提出無效假設(shè)(null hypothesis)和備擇假設(shè)(alternative hypothesis ),確定檢驗水準α 無效假設(shè)為正待檢驗的假設(shè): H0 備擇假設(shè)為可供選擇的假設(shè): H1 2.計算檢驗統(tǒng)計量3.確定P值,作出統(tǒng)計推斷結(jié)論,基本步驟,,1. 第一類錯誤(棄真錯誤)拒絕了實際上成立的H0假陽性錯誤,接受了錯誤的H1第一類錯誤的概率為α2. 第二類錯誤(存?zhèn)五e誤)不拒絕實際上不成

17、立的H0假陰性錯誤,接受了錯誤的H0第二類錯誤的概率為β,6. t檢驗,單樣本資料的t 檢驗兩獨立樣本資料的t 檢驗配對設(shè)計資料的t 檢驗,應(yīng)用條件隨機樣本;正態(tài)性(Normality):來自正態(tài)分布總體;方差齊性(Homogeneity of variance):兩個均數(shù)比較時,要求兩總體方差相等。,樣本與總體比較的t檢驗:配對設(shè)計t檢驗: 兩獨立

18、樣本t檢驗:,2024/3/21,53,單樣本定量資料分析流程,2024/3/21,54,兩獨立樣本定量資料的分析流程,2024/3/21,55,兩獨立樣本定量資料的分析流程,三、定性資料的統(tǒng)計分析,統(tǒng)計描述二項分布抽樣誤差與參數(shù)估計假設(shè)檢驗基礎(chǔ)卡方檢驗,要點,1.相對數(shù)的意義和應(yīng)用相對數(shù)的注意事項。2.常用相對數(shù)指標的計算方法和適應(yīng)范圍。3.率的標準化法的意義,直接法標化率的計算。4. 率的標準誤以及率的可信區(qū)間的計算。

19、5. 理解?2檢驗的基本思想, 熟悉?2檢驗的用途。6. 掌握幾種常見資料的?2檢驗方法。,1.統(tǒng)計描述,1.相對數(shù)的意義和應(yīng)用相對數(shù)的注意事項。2. 常用相對數(shù)指標的計算方法和適應(yīng)范圍。3. 率的標準化法的意義,直接法標化率的計算。,率(rate),概念:又稱頻率指標。表示在一定條件下,發(fā)生某現(xiàn)象的觀察單位數(shù)與可能發(fā)生某現(xiàn)象的觀察單位數(shù)之比。公式:作用:說明某現(xiàn)象發(fā)生的頻率或強度。,構(gòu)成比(proportion),概念:

20、構(gòu)成指標。表示某一事物內(nèi)部各組成部分 所占的比重或分布。公式:作用:表示某一事物內(nèi)部各組成部分所占的比重。,比(ratio),概念:表示兩個有關(guān)指標之比,說明二者的對比水平??捎帽稊?shù)或百分數(shù)表示。公式:,作用:說明甲指標為乙指標的若干倍或百分之幾。最常見的相對比是人口學(xué)中的男女性別比,反映衛(wèi)生資源的指標如每千人口醫(yī)生數(shù)及床位數(shù)等。,,,2.二項分布,二項分布的均數(shù)和標準差均數(shù)m=np 標準差s=陽

21、性率的均數(shù)mp=p; 標準差sp=樣本率的標準差也稱率的標準誤,用來描述樣本量的抽樣誤差。在一般情況下,總體率是未知的,常用樣本率p作為p 的估計值,二項分布的圖形特征,當? =0.5時,圖形對稱;當? ≠0.5時,圖形呈偏態(tài),但隨n的增大,圖形逐漸對稱。 高峰在 ?=n?處或附近因此,當n較大, ?不太極端時,一般地要求np>5且n(1-p)>5,可以采用正態(tài)近似方法計算概率分布規(guī)律,二項分布的概率分布示意圖,3.

22、卡方檢驗(四格表的畫法),卡方分布四格表資料的假設(shè)檢驗配對四格表的χ2 檢驗行列表資料的χ2 檢驗,,,,,,3.84,7.81,12.59,,,,,,,,P=0.05的臨界值,屬連續(xù)型分布;具有可加性;唯一參數(shù),自由度,單峰;偏態(tài)分布,Fourfold table,資料類型:四格表資料(定性資料)設(shè)計類型:兩獨立樣本,目的是推斷兩樣本所來自的總體率是否相等,即π1= π2 。,四格表資料的χ2檢驗的基本步驟,2.計算檢

23、驗統(tǒng)計量,n≥40且所有T≥5n≥40但有1≤T<5n<40或有T<1,A=0,Pearson’sChi-square test,Correction for continuity,χ2值反映了實際頻數(shù)和理論頻數(shù)的吻合程度;χ2值的大小受A和T相對差值以及格子數(shù)的共同影響;理論頻數(shù)的計算:,,行合計,列合計,總例數(shù),,兩種培養(yǎng)基白喉桿菌生長情況,73,配對設(shè)計分類變量資料的?2檢驗,甲、乙結(jié)果有兩種情況:

24、 一致:a(+)和 d(-); 不一致:b(甲+乙-)和c(甲-乙+);,McNemar 檢驗,,79,不同資料類型的?2檢驗的計算方法:,五、直線相關(guān)和回歸,要點 1.直線相關(guān)意義和用途。 2.相關(guān)系數(shù)r。,相關(guān)分析 (correlation analysis) 研究兩個或多個變量之間關(guān)聯(lián)性或關(guān)聯(lián)程度的一種統(tǒng)計分析方法。用于描述兩個隨機變量間線性相關(guān)方向和密切程度的方法稱為直線相關(guān),又稱簡單相關(guān)

25、。相關(guān)系數(shù) (correlation coefficient) 描述具有線性關(guān)系的兩變量間,相關(guān)關(guān)系的密切程度(大小)和相關(guān)方向的指標,總體相關(guān)系數(shù)用?表示,樣本相關(guān)系數(shù)用r表示。,相關(guān)系數(shù),X 的離均差平方和:Y 的離均差平方和:X與Y 間的離均差乘積和:,分類資料,,緒論,統(tǒng)計描述,參數(shù)估計:抽樣分布與參數(shù)估計,,,統(tǒng)計表和統(tǒng)計圖,統(tǒng)計推斷,,數(shù)值資料,,離散趨勢:,算術(shù)均數(shù)、幾何均數(shù)中位數(shù)、

26、百分位數(shù),集中趨勢:,極差、 四分位數(shù)間距、方差、標準差、變異系數(shù),變量,,正態(tài)分布、二項分布,,假設(shè)檢驗,t 檢驗,方差分析,,雙變量:相關(guān)分析,非參數(shù)檢驗,參數(shù)檢驗-數(shù)值變量,單變量,,數(shù)值/分類:秩和檢驗,分類變量:c2檢驗,,SPSS學(xué)習(xí)(自學(xué)),率、構(gòu)成比、相對比率的標準化—直接法、間接法,定量資料,前提條件,t / Z檢驗,單樣本,兩獨立樣本,配對設(shè)計,多獨立樣本,,,,,,,,不滿足t 檢驗/方差分析條件的,秩和檢驗

27、,隨機區(qū)組資料,析因設(shè)計資料,重復(fù)測量資料,,,,前提條件,前提條件,注意:對于符合參數(shù)統(tǒng)計分析者,采用非參數(shù)統(tǒng)計分析,會降低檢驗效能。,非參數(shù)檢驗nonparametric statistics,對總體的分布類型不作任何要求,特點:不受總體參數(shù)的影響,比較的是分布或分布位置。適用范圍: 廣,可用于任何類型資料。,,,,考試題型,單選題10*3判斷題10*2簡答題4綜合應(yīng)用題2總分:100分,第一章 緒論和統(tǒng)計學(xué)

28、基本知識,統(tǒng)計學(xué)基本概念:總體與樣本、同質(zhì)與變異、變量的類型、概率和小概率事件、參數(shù)與統(tǒng)計量。統(tǒng)計工作的基本步驟。,第三章 醫(yī)學(xué)資料的統(tǒng)計描述,了解頻數(shù)表的用途。掌握定量資料集中趨勢,離散趨勢的描述指標及各自適用條件。如何對正態(tài)分布資料和偏態(tài)分布資料進行 統(tǒng)計描述。,第三章 醫(yī)學(xué)資料的統(tǒng)計描述,率、構(gòu)成比、相對比的概念。應(yīng)用相對數(shù)時的注意事項。了解動態(tài)數(shù)列常用的指標。,熟悉統(tǒng)計表的結(jié)構(gòu)及列表的基本原則,能規(guī)范繪制統(tǒng)計表

29、。能根據(jù)資料類型選擇合適的統(tǒng)計圖對資料進行描述。掌握 基本概念:直條圖,直方圖,散點圖,圓圖。,第三章 醫(yī)學(xué)資料的統(tǒng)計描述,第四章 常用概率分布,掌握正態(tài)分布圖形特征及在醫(yī)學(xué)中的應(yīng)用。掌握醫(yī)學(xué)參考值范圍的概念及制定方法。,第五章 參數(shù)估計,抽樣誤差的概念,標準誤的計算。t分布的圖形特征??傮w均數(shù)置信區(qū)間的計算。均數(shù)置信區(qū)間和醫(yī)學(xué)參考值范圍的聯(lián)系及區(qū)別??傮w概率置信區(qū)間估計兩種方法的應(yīng)用條件。,第六章 假設(shè)檢驗,假

30、設(shè)檢驗中的Ⅰ型錯誤和Ⅱ型錯誤。假設(shè)檢驗中P的含義及其與檢驗水準α之間的區(qū)別。假設(shè)檢驗的注意事項。,第六章 假設(shè)檢驗,單樣本定量資料的統(tǒng)計分析思路:樣本來自正態(tài)分布總體時用t 檢驗;當數(shù)據(jù)來自偏態(tài)分布總體時,首先考慮采用變量變換,再考慮選用秩和檢驗。,第六章 假設(shè)檢驗,兩獨立樣本定量資料的統(tǒng)計分析思路:兩樣本均來自正態(tài)總體且總體方差齊時用t 檢驗;兩樣本來自正態(tài)總體但總體方差不齊時用t‘ 檢驗或秩和檢驗。當數(shù)據(jù)來自偏

31、態(tài)分布總體時,首先考慮采用變量變換,再考慮選用秩和檢驗。,第六章 假設(shè)檢驗,配對設(shè)計的含義及主要實施形式。 兩配對樣本定量資料的統(tǒng)計分析思路:若差值服從正態(tài)分布,可采用配對t檢驗;否則,采用配對資料的符號秩和檢驗。,四格表資料卡方檢驗的基本公式及各公式的適用條件。配對四格表卡方檢驗的基本公式及各公式的適用條件。行列表卡方檢驗的注意事項。,第六章 假設(shè)檢驗,第七章 簡單回歸和相關(guān)分析,掌握:相關(guān)系數(shù)的定義,相關(guān)系數(shù)估計方法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論