醫(yī)學(xué)統(tǒng)計(jì)學(xué)-教案:第七章計(jì)數(shù)資料的統(tǒng)計(jì)推斷

來源：南方醫(yī)科大學(xué)精品課程網(wǎng) 精品課程網(wǎng)

醫(yī)學(xué)統(tǒng)計(jì)學(xué):教案第七章計(jì)數(shù)資料的統(tǒng)計(jì)推斷:南方醫(yī)科大學(xué)教案首頁授課題目計(jì)數(shù)資料的統(tǒng)計(jì)推斷授課形式理論課授課時(shí)間授課學(xué)時(shí)3教學(xué)目的與要求1.熟悉卡方檢驗(yàn)的基本思想，卡方檢驗(yàn)的基本公式2.掌握兩個(gè)率比較、多個(gè)率比較、構(gòu)成比比較及配對(duì)資料的卡方檢驗(yàn)方法3.了解行×列表的卡方分割，四格表的確切概率法

南方醫(yī)科大學(xué)教案首頁

授課題目	計(jì)數(shù)資料的統(tǒng)計(jì)推斷	授課形式	理論課
授課時(shí)間		授課學(xué)時(shí)	3
教學(xué)目的與要求	1. 熟悉卡方檢驗(yàn)的基本思想，卡方檢驗(yàn)的基本公式 2. 掌握兩個(gè)率比較、多個(gè)率比較、構(gòu)成比比較及配對(duì)資料的卡方檢驗(yàn)方法 3. 了解行×列表的卡方分割，四格表的確切概率法 4. 了解頻數(shù)分布擬合優(yōu)度的卡方檢驗(yàn)
基本內(nèi)容	1. 四個(gè)表資料的卡方檢驗(yàn) 1)卡方檢驗(yàn)的基本思想及計(jì)算步驟 2)四格表卡方檢驗(yàn)的條件，卡方檢驗(yàn)的校正 2. 配對(duì)四格表資料的卡方檢驗(yàn) 3. 行×列表的卡方檢驗(yàn) 1) 多個(gè)率比較 2) 多個(gè)構(gòu)成比比較 3) 雙向有序資料的關(guān)聯(lián)性檢驗(yàn) 4．行×列表的卡方分割法 5．頻數(shù)分布擬和優(yōu)度的卡方檢驗(yàn) 6. 四格表的確切概率法
重點(diǎn) 難點(diǎn)	1. 簡(jiǎn)述卡方檢驗(yàn)的基本思想？ 2. 四格表卡方檢驗(yàn)有那兩種類型？各自在運(yùn)用上有何注意事項(xiàng)？ 3. 四格表卡方檢驗(yàn)各公式的適用條件？ 4. 理論頻數(shù)太小的三種處理方法？
主要教學(xué) 媒體	幻燈
主要外語詞匯	Chi-square distribution goodness of fit test
有關(guān)本內(nèi)容的新進(jìn)展	卡方檢驗(yàn)的兩兩比較方法的選擇
主要參考資料或相關(guān)網(wǎng)站	1. 徐勇勇主編. 醫(yī)學(xué)統(tǒng)計(jì)學(xué)（第二版). 北京：高等教育出版社，2004 2. 楊樹勤主編. 衛(wèi)生統(tǒng)計(jì)學(xué)（第二版). 北京：人民衛(wèi)生出版社，1991 3. 方積乾主編. 醫(yī)學(xué)統(tǒng)計(jì)學(xué)與電腦實(shí)驗(yàn)（第二版). 招生簡(jiǎn)章上海：上�？茖W(xué)技術(shù)出版社，2001 4. 孫振球主編. 醫(yī)學(xué)統(tǒng)計(jì)學(xué)（供研究生用). 北京：人民衛(wèi)生出版社，2004
系、教研室審查意見
課后體會(huì)

教學(xué)過程

教學(xué)內(nèi)容

時(shí)間分配和

媒體選擇

一. 率的抽樣誤差與可信區(qū)間

由于抽樣而引起的樣本率與總體率的差異稱為率的抽樣誤差。與均數(shù)的抽樣誤差可以用均數(shù)的標(biāo)準(zhǔn)誤度量一樣，率的抽樣誤差的大小亦可以用率的標(biāo)準(zhǔn)誤來度量。

例5-1 觀察某醫(yī)院產(chǎn)婦106人，其中行剖腹產(chǎn)者62人，剖腹產(chǎn)率為58.5%，試估計(jì)剖腹產(chǎn)率的標(biāo)準(zhǔn)誤。

解：已知n=106，p=0.585，由公式5-2求得標(biāo)準(zhǔn)誤為

二. 總體率的可信區(qū)間

與總體均數(shù)的估計(jì)相似，樣本率是總體率的點(diǎn)估計(jì)值。同樣，由于點(diǎn)估計(jì)的波動(dòng)較大，因此，我們還需要知道總體率大概會(huì)在一個(gè)什么樣的區(qū)間范圍，即所謂的總體率的可信區(qū)間估計(jì)。

（一) 二項(xiàng)分布法

例5-2 某婦幼保健院對(duì)當(dāng)?shù)?9對(duì)38例育齡夫婦的篩查中，檢出α-地中海貧血基因攜帶者3例，試估計(jì)當(dāng)?shù)卅?地中海貧血基因總體攜帶率的95%可信區(qū)間。

解：從附表8查得，在n=38橫行與發(fā)生數(shù)X=3縱列交叉處的數(shù)值為2-21，即α-地中海貧血基因總體攜帶率的95%可信區(qū)間為2%-21%，或曰有95%的可能當(dāng)?shù)卅?地中海貧血基因總體攜帶率是在2%-21%之間。

需注意，附表8只列出了發(fā)生數(shù)X≤n/2（發(fā)生率≤50%)的部分。當(dāng)X＞n/2時(shí)，應(yīng)按n-X值查表，并相應(yīng)地用100減去查得的數(shù)值，即為所求可信區(qū)間。

（二) 正態(tài)分布法

雙側(cè)： (p-u_α/2·S_p, p+u_α/2·S_p)

單側(cè)： p-u_α·S_p 或 p+u_α·S_p

例5-4 據(jù)例5.1數(shù)據(jù)，試估計(jì)總體剖腹產(chǎn)率的雙側(cè)95%可信區(qū)間。

解：依題意可查得u_0.05/2=1.96，將例5.1中求得的p=0.585，S_p =0.048代入，得

（0.585-1.96×0.048，0.585+1.96×0.048)=（0.491，0.679)

即該醫(yī)院產(chǎn)婦總體剖腹產(chǎn)率的95%可信區(qū)間為49.1%-67.9%。

值得注意的是，在計(jì)算可信區(qū)間時(shí)，有可能遇到可信區(qū)間的下限小于0%（即負(fù)值)，或可信區(qū)間的上限大于100%的情形。此時(shí)，應(yīng)相應(yīng)地將可信區(qū)間的下限表達(dá)為0%，可信區(qū)間的上限為100%。

三. 兩個(gè)率的比較

χ²檢驗(yàn)(chi-square test)是現(xiàn)代統(tǒng)計(jì)學(xué)的創(chuàng)始人Karl Pearson（1857-1936)于1900年提出的一種具有廣泛用途的統(tǒng)計(jì)方法，可用于兩個(gè)或多個(gè)率間的比較，計(jì)數(shù)資料的關(guān)聯(lián)度分析，擬合優(yōu)度檢驗(yàn)，等等。本章僅限于介紹兩個(gè)和多個(gè)率或構(gòu)成比比較的χ²檢驗(yàn)。

（一) 兩個(gè)獨(dú)立樣本率比較的χ²檢驗(yàn)

1．兩個(gè)獨(dú)立樣本率資料的四格表形式

表5-1 兩種療法的心血管病病死率比較

療法	死亡	生存	合計(jì)	病死率（%)
鹽酸苯乙雙胍	26（21.3)	178（182.7)	204	12.75
安慰劑	2（ 6.7)	62（ 57.3)	64	3.13
合計(jì)	28	240	268	10.45

2． χ²檢驗(yàn)的基本思想

χ²檢驗(yàn)的基本思想可以通過χ²檢驗(yàn)的理論公式（公式5-6和5-13)來理解。

式中，A為實(shí)際頻數(shù)（actual frequency)，T為理論頻數(shù)（theoretical frequency)。根據(jù)檢驗(yàn)假設(shè)H₀：π₁=π₂，即兩樣本來自同一總體，或曰兩總體率相同，則從理論上講，各處理組的發(fā)生率和總發(fā)生率應(yīng)相等

現(xiàn)回到理論公式5-6，若H₀成立，則四個(gè)格子的實(shí)際頻數(shù)A與理論頻數(shù)T相差不應(yīng)該很大，即χ²統(tǒng)計(jì)量不應(yīng)該很大。若χ²值很大，即相對(duì)應(yīng)的P值很小，比如P≤α，則反過來推斷A與T相差太大，超出了抽樣誤差允許的范圍，從而懷疑的H₀正確性，繼而拒絕H₀，接受其對(duì)立假設(shè)H₁，即π₁≠π₂。

3．假設(shè)檢驗(yàn)

⑴ 建立檢驗(yàn)假設(shè)，確定顯著性水平。

H₀：π₁=π₂，即兩種療法的心血管病總體病死率相同；

H₁：π₁≠π₂；

α=0.05。

⑵ 求檢驗(yàn)統(tǒng)計(jì)量χ²值。

① 非連續(xù)性校正χ²值

又稱Pearsonχ²統(tǒng)計(jì)量，公式5-6為理論計(jì)算公式。

② 連續(xù)性校正χ²值

又稱Yates校正χ²統(tǒng)計(jì)量（Yates' correction for continuity with the chi-square statistic)，是Pearsonχ²統(tǒng)計(jì)量的一個(gè)校正量。Yates（1934)認(rèn)為，χ²分布是一連續(xù)型分布，而四格表資料屬離散型分布，由此得到的χ²統(tǒng)計(jì)量的抽樣分布也是離散性質(zhì)的。為改善χ²統(tǒng)計(jì)量分布的連續(xù)性，他提出將實(shí)際頻數(shù)與理論頻數(shù)之差的絕對(duì)值減去0.5，于是理論公式5-6演變?yōu)楣?-15，故稱這種校正為連續(xù)性校正。

因連續(xù)性校正公式中的分子部分較非連續(xù)性校正公式減去了一個(gè)常量，故所得χ²值必然較后者小，即必然有χ²＞χ²_c。這一差別有時(shí)會(huì)導(dǎo)致相互矛盾的統(tǒng)計(jì)推斷結(jié)果。

⑶ 求P值，下結(jié)論。

由于四格表資料為雙邊固定形式，即假設(shè)行合計(jì)與列合計(jì)均固定，所以四格表的自由度ν=1。由χ²界值表（附表10)查得χ²_0.05_，1 =3.84，小于本例所得χ²值（無論是校正的或非校正的)，所以P＜0.05，按α=0.05水準(zhǔn)拒絕H₀，接受H₁，用鹽酸苯乙雙胍治療引致的心血管病病死率高于安慰劑

（二) 兩個(gè)相關(guān)樣本率比較的χ²檢驗(yàn)（McNemar檢驗(yàn))

1.資料類型：兩個(gè)相關(guān)樣本率資料又稱配對(duì)計(jì)數(shù)資料，顧名思義，是采用配對(duì)設(shè)計(jì)，且結(jié)果以計(jì)數(shù)方式表達(dá)的資料。

例5-9 某抗癌新藥的毒理研究中，將78只大鼠按性別、窩別、體重、年齡等因素配成39對(duì)，每對(duì)大鼠經(jīng)隨機(jī)分配分別接受甲劑量和乙劑量注射，實(shí)驗(yàn)結(jié)果見表5-4。試分析該新藥兩種不同劑量的毒性有無差異。

表5-4 某抗癌新藥兩種劑量的毒理實(shí)驗(yàn)結(jié)果

quanxiangyun.cn/shiti/

甲劑量	乙劑量	合計(jì)
死亡(+)	生存(-)
死亡(+)	6（a)	12（b)	18
生存(-)	3（c)	18（d)	21
合計(jì)	9	30	39

2. 假設(shè)檢驗(yàn)

對(duì)于表5-5資料，如果不考慮兩種處理結(jié)果相同的情形，即忽略甲+乙+的對(duì)子數(shù)a和甲-乙-的對(duì)子數(shù)d，而只考察甲+乙- 的對(duì)子數(shù)b與甲-乙+的對(duì)子數(shù)c之間有無差異，就產(chǎn)生了兩個(gè)相關(guān)樣本率比較的χ²檢驗(yàn)，又稱McNemar檢驗(yàn)（McNemar's test for correlated proportions)。

本例檢驗(yàn)過程如下：

H₀：兩總體b=c

H₁：兩總體b≠c

α=0.05

已知b=12，c=3，因b+c=15，故將其代入公式5-18，有