(一)基本概念
兩組平行組(試驗(yàn)器械,對(duì)照器械)的研究設(shè)計(jì),指標(biāo)為率(有效率、治愈率、緩解率、不良 事件率),可以表達(dá)為列聯(lián)表的形式,見(jiàn)表6-1。
這種研究設(shè)計(jì)的目的是通過(guò)兩組樣本的頻數(shù)分布情況來(lái)推測(cè)兩組樣本對(duì)應(yīng)的總體頻數(shù)分 布是否相同,表中各格數(shù)字a,b,c,d為一次抽樣得到的實(shí)際頻數(shù).也稱為觀測(cè)頻數(shù)。通過(guò)觀察頰數(shù)來(lái)推斷兩組總體頻數(shù)分布情況時(shí)肯定存在抽樣誤差,所以當(dāng)兩樣本頻率不相同時(shí)可能有兩種原因:
1.抽樣誤差所致。
2.這兩個(gè)樣本頻率對(duì)應(yīng)的總體概率(以下簡(jiǎn)稱總體率)本來(lái)就不同。 設(shè)行上指標(biāo)B1發(fā)生的概率為π1,設(shè)第二行上指標(biāo)B1發(fā)生的概率為π2,則平行組設(shè)計(jì) 2×2列聯(lián)表資料的假設(shè)檢驗(yàn)的零假設(shè)和備擇假設(shè)分別為:
H0: π1= π2(兩種器械的治療有效率相等)
H1: π1≠ π2(兩種器械的治療有效率不相等) 若上述的種原因成立,則α格中理論頻數(shù)為(m1/n)×n1.,即得到α格的理論頻數(shù),同 理可計(jì)算出各個(gè)格子上的理論頻數(shù),如表6-2。
如果零假設(shè)為真,則由式(6-6)定義的檢驗(yàn)統(tǒng)計(jì)量不會(huì)超過(guò)某臨界值;如果計(jì)算出的檢驗(yàn) 統(tǒng)計(jì)量越過(guò)該臨界值,則拒絕接受零假設(shè)。此處的假設(shè)檢驗(yàn)方法稱為Pearson χ2檢驗(yàn),其計(jì)算 公式如下:
上式中O代表實(shí)際頻數(shù),T代表理論頻數(shù),該式也可用于R×C列聯(lián)表資料的獨(dú)立性檢驗(yàn)。 在2×2表資料中,據(jù)表(6-6)和式(6-7)可知:
Ta…Td分別代表與觀察頻數(shù)a,b,c,d對(duì)應(yīng)的理論頻數(shù)。 所以,此處式(6-6)可轉(zhuǎn)化為計(jì)算2×2列聯(lián)表資料檢驗(yàn)統(tǒng)計(jì)量的專用公式:
由式(6-6)和式(6-7)計(jì)算出的χ2值近似服從自由度為ν的χ2分布,自由度ν按下式計(jì)算:
上式中R為行數(shù),C為列數(shù)。四格表資料中R和C均為2.所以ν=1,此時(shí),與α =0. 05和β =0.0l對(duì)應(yīng)的兩個(gè)臨界值分別為χ2 (1)0.05=3.841 和χ2 (1)0.01=6.630。 按式( 6-6)或式(6-7)計(jì)算出檢驗(yàn)統(tǒng)計(jì)量的值,根據(jù)χ2 分布規(guī)律、自由度廈檢驗(yàn)水準(zhǔn)可以得到相應(yīng)的臨界值,如果現(xiàn)有檢驗(yàn)統(tǒng)計(jì)量的值等于臨界值,則P=α:如果現(xiàn)有統(tǒng)計(jì)量大于檢驗(yàn) 臨界值,則P<α;如果現(xiàn)有統(tǒng)計(jì)量小于檢驗(yàn)臨界值,則P>α。得到尸值即可作出相應(yīng)的統(tǒng) 計(jì)推斷。
需要注意的是,運(yùn)用式(6-6)或式(6-7)計(jì)算檢驗(yàn)統(tǒng)計(jì)量χ2 的值的前提條什是:n≥40,無(wú)<5的理論頻數(shù);當(dāng)表格中n≥40,但至少有一個(gè)理論頻數(shù)為1<T≤5時(shí)需改用下面的連續(xù)校正 x2栓驗(yàn)公式計(jì)算檢驗(yàn)統(tǒng)計(jì)量χ2值:
當(dāng)表格中n <40或至少有一個(gè)理論頻數(shù)為T≤l時(shí),需要用Fisher R A借助超幾何分布提出的直接計(jì)算概率的方法,此方法被稱為Fisher精確檢驗(yàn)法。此方法不屬于χ2檢驗(yàn)的范疇,但可以作為四格表χ2檢驗(yàn)應(yīng)用的補(bǔ)充。四格表資料Fisher精確檢驗(yàn)法計(jì)算公式如下:
上式中丸為獲得某個(gè)四格表的概率,對(duì)于Fisher精確檢驗(yàn)法.P值就是“出現(xiàn)目前狀況 和更極端狀況的概率”,其計(jì)算方法就是將小于或等于“樣本觀察啦概率“”的所有可能結(jié)局的概率求和。之所以用Pα表示,因?yàn)樗怯^察到的2×2列聯(lián)發(fā)中與“a”取值直接有關(guān)系的概率。Fisher精確檢驗(yàn)法可作為四格表資料檢驗(yàn)的通用方法。
(二) 假設(shè)檢驗(yàn)的步驟
1.建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)對(duì)表6- 1數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析首先應(yīng)建立檢驗(yàn)假設(shè)。 H0:兩組(A1與A2:)在終點(diǎn)事件B的兩個(gè)水平(發(fā)生、不發(fā)生)上總體分布相同,都服從某 一理論分布,即 π1= π2 = πH1:兩組(A1與A2.)在終點(diǎn)事件B的兩個(gè)水平上息體分布不同.π1≠π2確定檢驗(yàn)水準(zhǔn)為α。
2.選擇檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量根據(jù)資料情況,可以選擇Pearsonχ2檢驗(yàn)或連續(xù)校 正的χ2檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量為χ2,或者用Fisher精確檢驗(yàn)法直接計(jì)算概率。 3根據(jù)檢驗(yàn)統(tǒng)計(jì)量的值確定P值,并作出統(tǒng)計(jì)推斷和專業(yè)結(jié)論根據(jù)式(6-6)或式(6-7)或式(6-10)可計(jì)算出檢驗(yàn)統(tǒng)計(jì)量χ2值,然后與相應(yīng)的檢驗(yàn)臨界值比較即可得到P值,或采用 Fisher精確檢驗(yàn)法直接得到P值,根據(jù)P值作出統(tǒng)計(jì)推斷和專業(yè)結(jié)論。
【例6 -1】某臨床試驗(yàn)欲比較人工胃內(nèi)水球與常規(guī)胃內(nèi)水球?qū)Ψ逝值寞熜В瑢⒉∏橄嘟?200名患者隨機(jī)均分成兩組分別用兩種水球進(jìn)行治療。結(jié)果見(jiàn)表6 -3,試分析兩種水球的治療效果之間的差別是否具有統(tǒng)計(jì)學(xué)意義。
本數(shù)據(jù)不代表真實(shí)療效,且數(shù)據(jù)需要經(jīng)過(guò)樣本音量計(jì)算,此處僅為說(shuō)明統(tǒng)計(jì)運(yùn)算使用分析與計(jì)算:表6 -3是關(guān)于兩種藥物治療效果的評(píng)價(jià),可視為橫斷面研究設(shè)計(jì)2×2表定性資料。因總頻數(shù)n=200>40,且無(wú)<5的理論頻數(shù),故可用式(6-7).即一般χ2檢驗(yàn)公式 汁算。
(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn):表6 -3是2×2列聯(lián)表,首先建立檢驗(yàn)假設(shè)。 H0:兩藥物的總體治療愈率相同,即 π1= π2
H1:兩藥物的總體治療愈率不同,即 π1≠π2
檢驗(yàn)水準(zhǔn)α=0.05。
(2)選擇檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量: 采用一般χ2檢驗(yàn)方法,檢驗(yàn)統(tǒng)計(jì)量為χ2,可手工按式(6-6)或式(6-7)計(jì)算,此處用SAS統(tǒng)計(jì)軟件實(shí)現(xiàn)統(tǒng)計(jì)分析。SAS程序(程序名CT6-1)如下:
SAS程序說(shuō)明:數(shù)據(jù)步,建立數(shù)據(jù)集名 為CT6-l.建立數(shù)值型變量a,b,f,分別讀入 稈號(hào)、列號(hào)、每格實(shí)際頻數(shù);進(jìn)程步,調(diào)用freq過(guò)程,指定頻數(shù)變量為f,用tables a*b語(yǔ)句表示二維列聯(lián)表資料,加參數(shù)chisq進(jìn)行一般χ2檢驗(yàn) SAS主要輸出結(jié)果如下: 部分:卡方檢驗(yàn)。
第二部分:Fisher精確檢驗(yàn)。 本例資料符合一般χ2檢驗(yàn)條件部分Chi-Square結(jié) 果,檢驗(yàn)統(tǒng)計(jì)量χ2值為6.639 6.P =0.0100。
(3)根據(jù)檢驗(yàn)統(tǒng)計(jì)量確定P值,并作出統(tǒng)計(jì)推斷和專業(yè)推 斷:在SAS分析結(jié)果中給出了P值,所以可以直接作出統(tǒng)計(jì)推斷,P=0.01<0. 05.拒絕H0,可以認(rèn)為兩種胃內(nèi)水球?qū)τ谥委?肥胖效果是不同的,新的人工胃內(nèi)水球的有效率比常規(guī)水球高。 對(duì)于多個(gè)平行組研究設(shè)計(jì)率的比較同2×2列聯(lián)表資料的方法是基本相同的,此處從略。