南方醫(yī)科大學(xué)教案首頁
授課題目 | 計(jì)數(shù)資料的統(tǒng)計(jì)推斷 | 授課形式 | 理論課 |
授課時(shí)間 | 授課學(xué)時(shí) | 3 | |
教學(xué)目的 與 要 求 | 1. 熟悉卡方檢驗(yàn)的基本思想,卡方檢驗(yàn)的基本公式 2. 掌握兩個(gè)率比較、多個(gè)率比較、構(gòu)成比比較及配對(duì)資料的卡方檢驗(yàn)方法 3. 了解行×列表的卡方分割,四格表的確切概率法 4. 了解頻數(shù)分布擬合優(yōu)度的卡方檢驗(yàn) | ||
基本內(nèi)容 | 1. 四個(gè)表資料的卡方檢驗(yàn) 1)卡方檢驗(yàn)的基本思想及計(jì)算步驟 2)四格表卡方檢驗(yàn)的條件,卡方檢驗(yàn)的校正 2. 配對(duì)四格表資料的卡方檢驗(yàn) 3. 行×列表的卡方檢驗(yàn) 1) 多個(gè)率比較 2) 多個(gè)構(gòu)成比比較 3) 雙向有序資料的關(guān)聯(lián)性檢驗(yàn) 4. 行×列表的卡方分割法 5. 頻數(shù)分布擬和優(yōu)度的卡方檢驗(yàn) 6. 四格表的確切概率法 | ||
重 點(diǎn) 難 點(diǎn) | 1. 簡(jiǎn)述卡方檢驗(yàn)的基本思想? 2. 四格表卡方檢驗(yàn)有那兩種類型?各自在運(yùn)用上有何注意事項(xiàng)? 3. 四格表卡方檢驗(yàn)各公式的適用條件? 4. 理論頻數(shù)太小的三種處理方法? | ||
主要教學(xué) 媒 體 | 幻燈 | ||
主 要 外 語 詞 匯 | Chi-square distribution goodness of fit test | ||
有關(guān)本內(nèi)容的新進(jìn)展 | 卡方檢驗(yàn)的兩兩比較方法的選擇 | ||
主要參考資料或相關(guān)網(wǎng)站 | 1. 徐勇勇主編. 醫(yī)學(xué)統(tǒng)計(jì)學(xué)(第二版). 北京:高等教育出版社,2004 2. 楊樹勤主編. 衛(wèi)生統(tǒng)計(jì)學(xué)(第二版). 北京:人民衛(wèi)生出版社,1991 3. 方積乾主編. 醫(yī)學(xué)統(tǒng)計(jì)學(xué)與電腦實(shí)驗(yàn)(第二版). 招生簡(jiǎn)章上海:上?茖W(xué)技術(shù)出版社,2001 4. 孫振球主編. 醫(yī)學(xué)統(tǒng)計(jì)學(xué)(供研究生用). 北京:人民衛(wèi)生出版社,2004 | ||
系、教研室 審查意見 | |||
課后體會(huì) |
教學(xué)過程
教學(xué)內(nèi)容 | 時(shí)間分配和 媒體選擇 | ||||||||||||||||||||||||||||||||||||||||||||||
一. 率的抽樣誤差與可信區(qū)間 由于抽樣而引起的樣本率與總體率的差異稱為率的抽樣誤差。與均數(shù)的抽樣誤差可以用均數(shù)的標(biāo)準(zhǔn)誤度量一樣,率的抽樣誤差的大小亦可以用率的標(biāo)準(zhǔn)誤來度量。 例5-1 觀察某醫(yī)院產(chǎn)婦106人,其中行剖腹產(chǎn)者62人,剖腹產(chǎn)率為58.5%,試估計(jì)剖腹產(chǎn)率的標(biāo)準(zhǔn)誤。 解:已知n=106,p=0.585,由公式5-2求得標(biāo)準(zhǔn)誤為 二. 總體率的可信區(qū)間 與總體均數(shù)的估計(jì)相似,樣本率是總體率的點(diǎn)估計(jì)值。同樣,由于點(diǎn)估計(jì)的波動(dòng)較大,因此,我們還需要知道總體率大概會(huì)在一個(gè)什么樣的區(qū)間范圍,即所謂的總體率的可信區(qū)間估計(jì)。 (一) 二項(xiàng)分布法 例5-2 某婦幼保健院對(duì)當(dāng)?shù)?9對(duì)38例育齡夫婦的篩查中,檢出α-地中海貧血基因攜帶者3例,試估計(jì)當(dāng)?shù)卅?地中海貧血基因總體攜帶率的95%可信區(qū)間。 解:從附表8查得,在n=38橫行與發(fā)生數(shù)X=3縱列交叉處的數(shù)值為2-21,即α-地中海貧血基因總體攜帶率的95%可信區(qū)間為2%-21%,或曰有95%的可能當(dāng)?shù)卅?地中海貧血基因總體攜帶率是在2%-21%之間。 需注意,附表8只列出了發(fā)生數(shù)X≤n/2(發(fā)生率≤50%)的部分。當(dāng)X>n/2時(shí),應(yīng)按n-X值查表,并相應(yīng)地用100減去查得的數(shù)值,即為所求可信區(qū)間。 (二) 正態(tài)分布法 雙側(cè): (p-uα/2·Sp, p+uα/2·Sp) 單側(cè): p-uα·Sp 或 p+uα·Sp 例5-4 據(jù)例5.1數(shù)據(jù),試估計(jì)總體剖腹產(chǎn)率的雙側(cè)95%可信區(qū)間。 解:依題意可查得u0.05/2=1.96,將例5.1中求得的p=0.585,Sp =0.048代入,得 (0.585-1.96×0.048,0.585+1.96×0.048)=(0.491,0.679) 即該醫(yī)院產(chǎn)婦總體剖腹產(chǎn)率的95%可信區(qū)間為49.1%-67.9%。 值得注意的是,在計(jì)算可信區(qū)間時(shí),有可能遇到可信區(qū)間的下限小于0%(即負(fù)值),或可信區(qū)間的上限大于100%的情形。此時(shí),應(yīng)相應(yīng)地將可信區(qū)間的下限表達(dá)為0%,可信區(qū)間的上限為100%。 三. 兩個(gè)率的比較 χ2檢驗(yàn)(chi-square test)是現(xiàn)代統(tǒng)計(jì)學(xué)的創(chuàng)始人Karl Pearson(1857-1936)于1900年提出的一種具有廣泛用途的統(tǒng)計(jì)方法,可用于兩個(gè)或多個(gè)率間的比較,計(jì)數(shù)資料的關(guān)聯(lián)度分析,擬合優(yōu)度檢驗(yàn),等等。本章僅限于介紹兩個(gè)和多個(gè)率或構(gòu)成比比較的χ2檢驗(yàn)。 (一) 兩個(gè)獨(dú)立樣本率比較的χ2檢驗(yàn) 1. 兩個(gè)獨(dú)立樣本率資料的四格表形式 表5-1 兩種療法的心血管病病死率比較
2. χ2檢驗(yàn)的基本思想 χ2檢驗(yàn)的基本思想可以通過χ2檢驗(yàn)的理論公式(公式5-6和5-13)來理解。
式中,A為實(shí)際頻數(shù)(actual frequency),T為理論頻數(shù)(theoretical frequency)。根據(jù)檢驗(yàn)假設(shè)H0:π1=π2,即兩樣本來自同一總體,或曰兩總體率相同,則從理論上講,各處理組的發(fā)生率和總發(fā)生率應(yīng)相等 現(xiàn)回到理論公式5-6,若H0成立,則四個(gè)格子的實(shí)際頻數(shù)A與理論頻數(shù)T相差不應(yīng)該很大,即χ2統(tǒng)計(jì)量不應(yīng)該很大。若χ2值很大,即相對(duì)應(yīng)的P值很小,比如P≤α,則反過來推斷A與T相差太大,超出了抽樣誤差允許的范圍,從而懷疑的H0正確性,繼而拒絕H0,接受其對(duì)立假設(shè)H1,即π1≠π2。 3. 假設(shè)檢驗(yàn) ⑴ 建立檢驗(yàn)假設(shè),確定顯著性水平。 H0:π1=π2,即兩種療法的心血管病總體病死率相同; H1:π1≠π2; α=0.05。 ⑵ 求檢驗(yàn)統(tǒng)計(jì)量χ2值。 ① 非連續(xù)性校正χ2值 又稱Pearsonχ2統(tǒng)計(jì)量,公式5-6為理論計(jì)算公式。 ② 連續(xù)性校正χ2值 又稱Yates校正χ2統(tǒng)計(jì)量(Yates' correction for continuity with the chi-square statistic),是Pearsonχ2統(tǒng)計(jì)量的一個(gè)校正量。Yates(1934)認(rèn)為,χ2分布是一連續(xù)型分布,而四格表資料屬離散型分布,由此得到的χ2統(tǒng)計(jì)量的抽樣分布也是離散性質(zhì)的。為改善χ2統(tǒng)計(jì)量分布的連續(xù)性,他提出將實(shí)際頻數(shù)與理論頻數(shù)之差的絕對(duì)值減去0.5,于是理論公式5-6演變?yōu)楣?-15,故稱這種校正為連續(xù)性校正。 因連續(xù)性校正公式中的分子部分較非連續(xù)性校正公式減去了一個(gè)常量,故所得χ2值必然較后者小,即必然有χ2>χ2c。這一差別有時(shí)會(huì)導(dǎo)致相互矛盾的統(tǒng)計(jì)推斷結(jié)果。 ⑶ 求P值,下結(jié)論。 由于四格表資料為雙邊固定形式,即假設(shè)行合計(jì)與列合計(jì)均固定,所以四格表的自由度ν=1。由χ2界值表(附表10)查得χ20.05,1 =3.84,小于本例所得χ2值(無論是校正的或非校正的),所以P<0.05,按α=0.05水準(zhǔn)拒絕H0,接受H1,用鹽酸苯乙雙胍治療引致的心血管病病死率高于安慰劑 (二) 兩個(gè)相關(guān)樣本率比較的χ2檢驗(yàn)(McNemar檢驗(yàn)) 1.資料類型:兩個(gè)相關(guān)樣本率資料又稱配對(duì)計(jì)數(shù)資料,顧名思義,是采用配對(duì)設(shè)計(jì),且結(jié)果以計(jì)數(shù)方式表達(dá)的資料。 例5-9 某抗癌新藥的毒理研究中,將78只大鼠按性別、窩別、體重、年齡等因素配成39對(duì),每對(duì)大鼠經(jīng)隨機(jī)分配分別接受甲劑量和乙劑量注射,實(shí)驗(yàn)結(jié)果見表5-4。試分析該新藥兩種不同劑量的毒性有無差異。 表5-4 某抗癌新藥兩種劑量的毒理實(shí)驗(yàn)結(jié)果
2. 假設(shè)檢驗(yàn) 對(duì)于表5-5資料,如果不考慮兩種處理結(jié)果相同的情形,即忽略甲+乙+的對(duì)子數(shù)a和甲-乙-的對(duì)子數(shù)d,而只考察甲+乙- 的對(duì)子數(shù)b與甲-乙+的對(duì)子數(shù)c之間有無差異,就產(chǎn)生了兩個(gè)相關(guān)樣本率比較的χ2檢驗(yàn),又稱McNemar檢驗(yàn)(McNemar's test for correlated proportions)。 本例檢驗(yàn)過程如下: H0:兩總體b=c H1:兩總體b≠c α=0.05 已知b=12,c=3,因b+c=15,故將其代入公式5-18,有
查χ2界值表(附表10),得0.025<P<0.05,按α=0.05水準(zhǔn)拒絕H0,接受H1,可以認(rèn)為兩種劑量的毒性有顯著性差異,甲劑量組的死亡率較高(因b>c)。 (三)兩組構(gòu)成比的比較 例5-12 為研究?jī)煞N口服潔腸劑的不良反應(yīng),將192例接受潔腸處理的患者隨機(jī)分為兩組,一組94例口服硫酸鎂;另一組98例口服甘露醇。服后的反應(yīng)見表5-6,試比較之。 解: ① 建立檢驗(yàn)假設(shè),確定顯著性水準(zhǔn)。 H0:兩處理組的總體構(gòu)成相同; H1:兩處理組的總體構(gòu)成不同; α=0.05。 ② 求檢驗(yàn)統(tǒng)計(jì)量和自由度。將表5-6數(shù)據(jù)代入公式5-22,有 χ2=80.69,df=4 求P值,下結(jié)論。查χ2界值表(附表10)ν=4一行,因χ2=80.69>χ20.005,4=14.86,所以,P<0.005,以α=0.05水準(zhǔn)拒絕H0,接受H1,即兩種潔腸劑的服后反應(yīng)構(gòu)成不同,以甘露醇的不良反應(yīng)率較高。 |