檢驗(yàn)兩個(gè)樣本均數(shù)相差的顯著性時(shí),我們先有假定:第一個(gè)樣本系從均數(shù)為μ1、方差為σ12的正態(tài)總體中隨機(jī)取出,第二個(gè)樣本取自另一個(gè)類(lèi)似的總體,相應(yīng)的總體參數(shù)為μ2與σ22,兩個(gè)總體的方差應(yīng)相等即σ12=σ22,然后才可用上述方法進(jìn)行顯著性檢驗(yàn),如果資料呈顯著偏態(tài),或兩組方差相差懸殊,就要考慮用第十章非參數(shù)統(tǒng)計(jì)方法處理,或者通過(guò)變量代換,使上述條件得到滿(mǎn)足。那么,怎樣知道手頭的樣本資料是否服從正態(tài)分布及兩組方差是否相差顯著呢?要對(duì)手頭資料作正態(tài)檢驗(yàn)及方差齊性檢驗(yàn)。下面分別用實(shí)例介紹常用的正態(tài)性檢驗(yàn)和兩方差齊性檢驗(yàn)的方法。
有些統(tǒng)計(jì)方法只適用于正態(tài)分布或近似正態(tài)分布資料,如用均數(shù)和標(biāo)準(zhǔn)差描述資料的集中或離散情況,用正態(tài)分布法確定正常值范圍及用t檢驗(yàn)兩均數(shù)間相差是否顯著等,因此在用這些方法前,需考慮進(jìn)行正態(tài)性檢驗(yàn)。
正態(tài)分布的特征是對(duì)稱(chēng)和正態(tài)峰。分布對(duì)稱(chēng)時(shí)眾數(shù)和均數(shù)密合,若均數(shù)-眾數(shù)>0,稱(chēng)正偏態(tài)。因?yàn)橛猩贁?shù)變量值很大,使曲線(xiàn)右側(cè)尾部拖得很長(zhǎng),故又稱(chēng)右偏態(tài);若均數(shù)-眾數(shù)<0稱(chēng)負(fù)偏態(tài)。因?yàn)橛猩贁?shù)變量值很小,使曲線(xiàn)左側(cè)尾部拖得很長(zhǎng),故又稱(chēng)左偏態(tài),見(jiàn)圖7.1(a)。
正態(tài)曲線(xiàn)的峰度叫正態(tài)峰,見(jiàn)圖7.1(b)中的虛線(xiàn),離均數(shù)近的或很遠(yuǎn)的變量值都較正態(tài)峰的多的稱(chēng)尖峭峰,離均數(shù)近或很遠(yuǎn)變量值都較正態(tài)峰的少的稱(chēng)平闊峰。
圖7.1 頻數(shù)分布的偏度和峰度
正態(tài)性檢驗(yàn)的方法有兩類(lèi)。一類(lèi)對(duì)偏度、峰度只用一個(gè)指標(biāo)綜合檢驗(yàn),另一類(lèi)是對(duì)兩者各用一個(gè)指標(biāo)檢驗(yàn),前者有W法、D法、正態(tài)概率紙法等,后者有動(dòng)差法亦稱(chēng)矩法,F(xiàn)僅將W法與動(dòng)差法分述于下;
1.W法 此法宜用于小樣本資料的正態(tài)性檢驗(yàn),尤其是n≤50時(shí),檢驗(yàn)步驟如下;
(1)將n個(gè)變量值Xi從小至大排隊(duì)編秩。
X1<X2<……<XN<p
見(jiàn)表7.5第(1)欄,表中第(2)、第(3)欄是變量值,第(2)欄由上而下從小至大排列,第(3)欄由下而上從小至大排列。第(4)欄是第(3)欄與第(2)欄之差。
(2)由附表5按n查出ain系數(shù)列入表7.5第(5)欄,由于當(dāng)n為奇數(shù)時(shí),對(duì)應(yīng)于中位數(shù)秩次的ain為0,所以中位數(shù)只列出,不參加計(jì)算。第(6)欄是第(5)欄與第(4)欄的乘積。
(3)按式(7.8)計(jì)算W值
(7.8)
式中分子的∑,當(dāng)n是偶數(shù)時(shí),為 的縮寫(xiě),當(dāng)n是奇數(shù)時(shí)為 的縮寫(xiě),表7.5
第(6)欄的合計(jì)平方后即為分子。分母按原始資料計(jì)算。
(4)查附表6得P值,作出推斷結(jié)論,按n查得W(n,α),α是檢驗(yàn)前指定的檢驗(yàn)水準(zhǔn),若W>W(n,α)則在α水準(zhǔn)上按受H0,資料來(lái)自正態(tài)分布總體,或服從正態(tài)分布;若W≤W(n,α),則在α水準(zhǔn)上拒絕H0,接受H1,資料非正態(tài)。
例7.8 測(cè)得20例40—49歲健康人右側(cè)腓總神經(jīng)的傳導(dǎo)速度(m/sec)如表7.5第(2)、第(3)欄,試檢驗(yàn)此資料是否服從正態(tài)分布。
H0:總體服從正態(tài)分布
H1:總體為非正態(tài)分布
α=0.05
計(jì)算表7.5各欄。
表7.5 W法正態(tài)性檢驗(yàn)計(jì)算表
秩號(hào) | 傳導(dǎo)速度(m/sec) | ||||
i (1) | Xi (2) | Xa-i+1 (3) | Xa-i+1-Xi (4)=(3)-(2) | ain (5) | ain(Xa-i+1-Xi) (6)=(5)(4) |
1 | 40.7 | 56.7 | 16.0 | 0.4734 | 7.5744 |
2 | 40.9 | 56.0 | 15.1 | 0.3211 | 4.8486 |
3 | 46.0 | 55.0 | 9.0 | 0.2565 | 2.3085 |
4 | 47.6 | 54.9 | 7.3 | 0.2085 | 1.5221 |
5 | 47.7 | 53.5 | 5.8 | 0.1686 | 0.9779 |
6 | 48.3 | 52.9 | 4.6 | 0.1334 | 0.6136 |
7 | 49.1 | 51.8 | 2.7 | 0.1013 | 0.2735 |
8 | 50.0 | 50.9 | 0.9 | 0.0711 | 0.0640 |
9 | 50.1 | 50.9 | 0.8 | 0.0422 | 0.0338 |
10 | 50.2 | 50.8 | 0.6 | 0.0140 | 0.0084 |
18.2240∑ain(Xa-i+1-Xi) |
∑Xi=1004 ∑Xi2=50756.16 ∑(X-x)2=355.36
代入式(7.8)
W=(18.2240)2/355.36=0.9347
查附表6,n=20,α=0.05,W(20,0.05)=0.905
W>W(20,0.05) P>0.1,在α=0.05水準(zhǔn)上接受H0,該資料服從正態(tài)分布。
2.動(dòng)差法 又稱(chēng)矩法。既能用于小樣本資料,亦可用于大樣本資料的正態(tài)性檢驗(yàn)。本法運(yùn)用數(shù)學(xué)上三級(jí)動(dòng)差和四組動(dòng)差分別組成偏度系數(shù)與峰度系數(shù),然后檢驗(yàn)資料中否服從正態(tài)分布。當(dāng)頻數(shù)分布為正態(tài)時(shí),偏度系數(shù)與峰度系數(shù)分別等于0,但從正態(tài)分布總體中抽出的隨機(jī)樣本,由于存在抽樣誤差,其樣本偏度系數(shù)g1與樣本峰度系數(shù)g2不一定為0,為此,需檢驗(yàn)g1、g2與0的相差是否有顯著性。其檢驗(yàn)假設(shè)為①偏度系數(shù)等于O,即頻數(shù)分布對(duì)稱(chēng);②峰度系數(shù)等于0,即為正態(tài)峰。
偏度系數(shù)g1、峰度系數(shù)g2的公式見(jiàn)式quanxiangyun.cn(7.9)與(7.11)。當(dāng)用頻數(shù)表資料計(jì)算時(shí)可用式(7.10)與式(7.12),式中n為例數(shù),f為頻數(shù)。
(7.10)
(7.11)
(7.12)
g1、g2的抽樣誤差分別為Sg1與Sg2,見(jiàn)式(7.13)與式(7.14)
(7.13)
(7.14)
假設(shè)檢驗(yàn)用u檢驗(yàn),其公式為
u1=g1/Sg1 (7.15)
u2=g2/Sg2 (7.16)
u的顯著性界限為
∣u∣<1.96P>0.05在α=0.05的水準(zhǔn)上接受H0。
1.96≤∣u∣<2.580.05≥P>0.01在α=0.05的水準(zhǔn)上拒絕H0。
∣u∣≥2.58P≤0.01在α=0.01的水準(zhǔn)上拒絕H0。
例7.9 用動(dòng)差法檢驗(yàn)例7.8的資料是否服從正態(tài)分布。
1.H0:頻數(shù)分布對(duì)稱(chēng),H1:頻數(shù)分布不對(duì)稱(chēng)。
2.H0:頻數(shù)分布為正態(tài)峰,H1:頻數(shù)分布不是正態(tài)峰。
α=0.05
∑(X-x )2=355.36,∑(X-x )3=-1032.45
∑(X-x )4=20150.4316 n=20
u2=0.6221/0.9924=0.627 P&gquanxiangyun.cn/pharm/t;0.20
在α=0.05的水準(zhǔn)上接受H0,頻數(shù)分布對(duì)稱(chēng)(P>0.05),并為正態(tài)峰(P>0.20)。因此可認(rèn)為該資料服從正態(tài)分布。
方差齊性檢驗(yàn)的方法是以?xún)煞讲钪休^大的方差為分子,較小的方差為分母求一比值(稱(chēng)為F值),然后將求得的F值與臨界值比較,看相差是否顯著,現(xiàn)舉一例說(shuō)明。
例7.10 某單位測(cè)定了蓄電池廠(chǎng)工人32號(hào),得尿氨基乙酰丙酸(mg/l)的平均含量為7.06,方差為42.3072,又測(cè)定了化工廠(chǎng)工人6名,得平均含量為3.48,方差為0.9047,試比較兩方差的相差是否有顯著意義?
檢驗(yàn)假設(shè)H0:σ12=σ22,H1:σ12≠σ22α=0.05
定方差較大的一組為第1組,較小者為第2組,求出F值,公式為
F=S12/S22,S1>S2 (公式7.17)
本例F=42.3072/0.9047=46.76
現(xiàn)將F值與附表7中的F.05(ν1,ν2)比較。該表上端數(shù)值是較大均方(即方差)的自由度,用v1表示,左側(cè)的數(shù)值是較小均方的自由度,用ν2表示。本例ν1=n1-1=32-1=31(表內(nèi)ν1縱行沒(méi)有31,可查鄰近的數(shù)值30),ν2=n2-1=6-1=5,查得F.05(30,5)=6.23,本例F=46.76>F.05(30,5),P<0.05,故在α=0.05水準(zhǔn)處拒絕H0,接受H1。兩方差的差別顯著。