對于結(jié)局變量為定型變量的多個平行組設(shè)計,兩兩比較的方法有很多種,這里著重介紹 R×2、R×C列聯(lián)表資料兩兩比較的些方法,并給出一些SAS程序供讀者參考。
(一)R×2列聯(lián)表資料的兩兩比較
R×2列聯(lián)表資料的兩兩比較也稱率的多重比較,可分為各試驗(yàn)組與對照組的比較和全部組間的兩兩比較。前者可分析各試驗(yàn)組與對照組之間頻數(shù)分布的差異有無統(tǒng)計學(xué)意義,后者 可分析任意兩組間頻數(shù)分布的差異有尤統(tǒng)計學(xué)意義。若直接采用多次2×2列聯(lián)表資料的Z2檢驗(yàn)或Fisher精確檢驗(yàn)來進(jìn)行R×2列聯(lián)表資料的兩兩比較,將會明顯增大犯假陽性錯誤的概率。幽此,統(tǒng)計學(xué)界提出了一些校正的方法,目前已有30種之多,下面簡要介紹一些常用的兩兩比較方法。
1.調(diào)整顯著性水準(zhǔn)
(l)各試驗(yàn)組與對照組之間的比較:般采用Brunden法•它是由M .N.Brundcn于1972年提出的,其顯著性水準(zhǔn)的計算公式為:
式中α’為調(diào)整后的顯著肚水準(zhǔn),并以它作為評價各試驗(yàn)組i與劉照組之間的差異是否有統(tǒng)計學(xué)意義的共同顯著性水準(zhǔn)。α為研究者規(guī)定的一般絲著眺水準(zhǔn),常為0 05或0 01。^為樣本率的個散,即列聯(lián)表資料的行數(shù)。如對于一個5×2的州聯(lián)表資料,它有4個試驗(yàn)組和1個對照組,在統(tǒng)計分析后認(rèn)為5個組間的頻數(shù)分布不完全相同時,欲進(jìn)一步研究哪砦試驗(yàn) 組與對照組的頻數(shù)分布不同,需進(jìn)行4次試驗(yàn)組與對照組的比較。所以,k = 5,而需要比較 的次數(shù)為k-1=4.調(diào)整后的顯著性水準(zhǔn)就變?yōu)閍/[2×(5—1)],即α/8。需要說明的是,由該方法估計的檢驗(yàn)水準(zhǔn)α’可以使研究者犯假陽性錯誤的概率人大降低,但另一方面,該檢驗(yàn)水準(zhǔn)也比較保守
(2)各組間的兩兩比較:調(diào)整各組間兩兩比較的顯著陛水準(zhǔn)應(yīng)用較為廣泛的有兩種力法, 分別是Bonferroni和Sidak方法。 Bonferroni方法是通過將兩兩比較所獲得的P值乘以一定的倍數(shù)(兩兩比較的次數(shù))來實(shí) 現(xiàn)對兩兩比較原始P值的校正。設(shè)校正后的P值為P’.某一分表假設(shè)檢驗(yàn)獲得的P值仍記 為P,兩者之間的關(guān)系可表示如下:
Sidak方法通過另一種方法對兩兩比較所獲得的P值進(jìn)行修正。設(shè)校正后的P值為P’ 某一分表假設(shè)檢驗(yàn)獲得的P值仍記為P,兩者之間的關(guān)系可表示如下:
其中n為兩兩比較的次數(shù),其計算公式同(8-31)
與Bonferroni方法類似,這也是修正兩兩比較似駛檢驗(yàn)所得的P值,更常用的做法則是修正臨界水準(zhǔn)。設(shè)α’為調(diào)整后的顯著性水準(zhǔn),并以它作為評價各組間的兩兩比較的共同顯著性水準(zhǔn)。α為研究者規(guī)定的一般顯著性水準(zhǔn),則α’與α的關(guān)系可表示如下:
Sidak方法與Bonferroni方法類似,區(qū)別在于它們修正P值或顯著性水準(zhǔn)α的汁算方法略有差異。前者通過汁箅多次兩兩比較后犯假陽性錯誤概率的理論值1(1 -α’)n,并使1-(1 -α’)n控制在原本設(shè)想的假陽性錯誤概率α之內(nèi)來實(shí)現(xiàn)的,后者是通過控制多擻兩兩比較的假陽性錯誤概率之和在原本設(shè)想的假陽性錯誤概率α之內(nèi)來實(shí)現(xiàn)的。理論上來講,前者更為精確,可從理論上進(jìn)行推導(dǎo)獲得,后者更大程度上是一種經(jīng)驗(yàn)上的簡便算法。兩者的差異不 是很犬,讀者可根據(jù)實(shí)際需要選用,若上述兩種方法的假設(shè)檢驗(yàn)結(jié)果存在矛盾,建議讀者多采 用一些兩兩比較的方法進(jìn)行檢驗(yàn)并結(jié)合臨床專業(yè)情況來決定取何種結(jié)果。
2.基于重復(fù)抽樣的1300tst rap方法或Permutation方法 SAS的Multtest過程(即多重檢驗(yàn)過程),提供了兩種方法來進(jìn)行各試驗(yàn)組與對照組的比較或各組間的兩兩比較,即Boot-strap(自助法)和Permutation(置換法)方法,這兩種方法均基于重復(fù)抽樣。Bootstrap和Permutation分別用有放回和無放回的方法對數(shù)據(jù)進(jìn)行重抽樣,來逼近所有檢驗(yàn)中小P值的分 布,然后用該分布對單個原始P值進(jìn)行修正。
【例8-4】某臨床試驗(yàn)研究使用3種理療儀對治療膝關(guān)節(jié)疼痛的治療效果,同時設(shè)立常規(guī)器械作為對照組,治療結(jié)果見表8-2?,F(xiàn)已經(jīng)過統(tǒng)計分析得出各組間改善率不完全相同,需進(jìn) 一步研究哪些試驗(yàn)組與對照組之間改善率的差異存在統(tǒng)計學(xué)意義。
SAS程序及說明,SAS程序見CT8-4
裎序中第①步為創(chuàng)建兩兩比較的宏,包含兩個宏參數(shù):數(shù)據(jù)集名稱dataset和列聯(lián)表行數(shù)a(即組數(shù)),在調(diào)用這個宏時需要給出這兩個宏參數(shù)的值。第②步為創(chuàng)建兩個表,分別包含對比組名稱和對比結(jié)果P值(見第⑤步),用來幫助輸出后兩兩比較的結(jié)果。第③步為將原 R×C表分割成由每一個試驗(yàn)組分別與對照組構(gòu)成的2×2表。第④步為對每個分割表進(jìn)行 Fisher精確檢驗(yàn),并將相應(yīng)的P值輸出。因?yàn)榇撕陮γ恳粋€2×2列聯(lián)表都執(zhí)行相同的統(tǒng)計 檢驗(yàn),所以建議讀者僅當(dāng)所有分割出來的2×2列聯(lián)袤都滿足一般χ2檢驗(yàn)的應(yīng)用條件時,才能用χ2檢驗(yàn)替代本步內(nèi)的Fisher精確檢驗(yàn)。否則,都采用Fisher精確檢驗(yàn)即可。此步中的首行“ods listing close;”及尾行“ods listing;”調(diào)用了SAS輸出傳送系統(tǒng)(output delivery system).目的是在結(jié)果中不輸出對每個分割表的統(tǒng)計分析結(jié)果。若讀者認(rèn)為需要每個分割表的 統(tǒng)計分析結(jié)果,可將此兩句同時刪除。第⑤步為將對比組名稱插入pTestl襄中,將對比結(jié)果P值插入pTest2表中,此步驟與第二步相呼應(yīng)。第@步為將pTestl和pTest2兩個表合并,使后輸出的統(tǒng)計分析結(jié)果簡單清晰。第⑦步為采用Brunden法對每一個分割表處理所獲 得的Fisher精確檢驗(yàn)的P值進(jìn)行修正。第⑧步為將兩兩比較的結(jié)果輸出,同時調(diào)用SAS輸 出傳送系統(tǒng)將結(jié)果輸出為html格式。第⑧步為創(chuàng)建數(shù)據(jù)集。第⑩步為宏rc輸入兩個宏參數(shù) 的值,數(shù)據(jù)集名稱為CT84,列聯(lián)表行數(shù)為4,即調(diào)用宏。 輸出結(jié)果:
輸出結(jié)果的解釋:以上是4×2列聯(lián)表各試驗(yàn)組與對照組兩兩比較的結(jié)果,第2列“com-pare”給出了進(jìn)行比較的組別,第3列“P”為對分割表進(jìn)行Fisher精確檢驗(yàn)的雙側(cè)尾端概率值,第4列“PJ”是采用Brunden法校正后的P值,滇者在下統(tǒng)計結(jié)論時應(yīng)以此列為準(zhǔn)。從上 面的結(jié)果中可以看出,若以0. 05水平為基準(zhǔn),第4組(第3試驗(yàn)組)與第1組(對照組)之間改 善率的差別具有統(tǒng)計學(xué)意義。 R×2列聯(lián)表資料中,各試驗(yàn)組與對照組之間的兩兩比較也可以通過SAS的Multtest過 程來實(shí)現(xiàn),SAS程序及結(jié)果如下。 SAS程序及說明:SAS程序見CT85。
笫①步為創(chuàng)建數(shù)據(jù)集,需要注意的是結(jié)果變趕的取值必須為O或1,這是接下來要調(diào)用的Multtest過程規(guī)定的,但其賦值順序(既0,l或l,0)不影響終的結(jié)果。第②步調(diào)用Multtesi過程,采用permutation方法(或采用bootstrap方法,兩者的區(qū)別在于重抽樣是否為有放回抽樣)來修正P值,需要設(shè)定樣本量nsample和隨機(jī)種子數(shù)seed,nsample表示采用permuta-tion或bootstrap時所使用的重抽樣次數(shù),缺省值為100,seed為規(guī)定一個正整數(shù)作為重抽樣 的隨機(jī)數(shù)發(fā)生器的初始種子,缺省值為計算機(jī)時鐘值。Test語句后規(guī)定檢驗(yàn)統(tǒng)計量,做R×2列聯(lián)表的多重比較在這里只能選用Fisher精確檢驗(yàn),因?yàn)镸ulttest過程不提供χ2檢驗(yàn)。 Fisher(*)中,“*”代表結(jié)果變量,class后接原因變量。contrast語句后規(guī)定需要進(jìn)行比較的組,只能為-1.0,1 3個取值,其中取值為l的組被合并,取值為-l的組授合并,兩合并組進(jìn) 行比較,取值為0的組不參與比較。本例中,統(tǒng)計分析的目的是進(jìn)行兩兩比較,所以每次只有 一個取值為1的組和一個取值為-l的組之間的比較,不會合并組然后進(jìn)行比較。第③步將 兩兩比較的結(jié)果輸出。
注意:對1一這種一個對照組與多個試驗(yàn)組進(jìn)行兩兩比較的情況,采用MullIest過程,可不 必寫出contrast語句,SAS自動生成所有試驗(yàn)組與對照組的對比,但必須在SAS數(shù)據(jù)步中將 對照組的數(shù)據(jù)首先錄入,因?yàn)镾AS默認(rèn)class后的變址的水平為對照組。此外,對于所有 組間的兩兩比較則不能缺省contrast語句,必須將需要對比的所有組一一列出。 輸出結(jié)果:
輸出結(jié)果的解釋:以上足采用SAS的Multtest過程獲得的4×2列聯(lián)表各試驗(yàn)組與對照組兩兩比較的結(jié)果。其中,第9列“raw_P”是劃分割喪進(jìn)行Fisher精確檢驗(yàn)的雙側(cè)尾端概率值,第10列“perm_P”是采用permutation方法對數(shù)掘進(jìn)行重抽樣后估計的P值,讀者在下統(tǒng)計結(jié)論時應(yīng)以此剮為準(zhǔn)。從L面的結(jié)果中可以看出,若以0.05水平為基準(zhǔn),則組號第心組(即對照組與試驗(yàn)第3組)之問改善率的差異有統(tǒng)計學(xué)意義。
【例8 5】使用【例8-4】的數(shù)據(jù),現(xiàn)已經(jīng)過統(tǒng)計分析得出各組間改善率不完牟相同,對四組(3個試驗(yàn)組,1個對照)之間進(jìn)行兩兩比較,分析每兩組改善率的差異是否存在統(tǒng)計學(xué) 意義。 SAS裎序及說明:SAS程序見CT8 -6。
此程序與例8-4中個SAS程序基本相同,區(qū)別只有兩處。處為第②步與第③步 之間的do循環(huán)語句,例17-2個SAS程序中此位置的do循環(huán)語句是為了將R×2列聯(lián)表 分割成由每一個試驗(yàn)組分別與對照組組合而成的多個2×2列聯(lián)表,而本例的do循環(huán)語句是 為了將R×2列聯(lián)表分割成任意兩個組都分別進(jìn)行組合而成的多個2×2列聯(lián)表。另外第⑦ 步中修正P值的方法也不相同,例8 4采用Brunden法修正P值,而本例采用Bonferroni法 修正P值。其他步驟的SAS程序?qū)崿F(xiàn)目的與例8-4中個SAS程序相同。 輸出結(jié)果:
輸出結(jié)果的解釋:以上是4×2列聯(lián)表各組兩兩比較的結(jié)果,第2列“compare”給出了進(jìn)行比較的組別,第3列“P”為對分割表進(jìn)行Fisher精確檢驗(yàn)的雙側(cè)尾端概率值,第4列“Pj”是采 用Bonferroni法校正后的P值,讀者在下統(tǒng)計結(jié)論時應(yīng)以此列為準(zhǔn)。從上面的結(jié)果中可以看 出,第1組與第4組(對照組與試驗(yàn)3組)、第3組與第4組(試驗(yàn)2組與試驗(yàn)3組)改善率差別 具有統(tǒng)計學(xué)意義。
R×2列聯(lián)表資料中,各組之間的兩兩比較也可以通過SAS的Multtest過程來實(shí)現(xiàn),SAS程序及結(jié)果如下。
輸出結(jié)果的解釋:以上是采用SAS的Multtest過程獲得的9×2列聯(lián)表各組兩兩比較的結(jié)果。其中,第8列“raw_P”是對分割表進(jìn)行Fisher精確檢驗(yàn)的雙側(cè)尾端概率值,第9列 “perm_P是采用Permutation方法對數(shù)據(jù)進(jìn)行螢抽樣后估計的P值,下統(tǒng)計結(jié)論時應(yīng)以此列為準(zhǔn)。第1組與第4組(對照組與試驗(yàn)3組)、第3組與第4組(試驗(yàn)2組與試驗(yàn)3組)改善率 差別具有統(tǒng)計學(xué)意義。
(二)R×C列聯(lián)表資料的兩兩比較
與R×2列聯(lián)表兩兩比較不同,R×C列聯(lián)表兩兩比較目前研究并不多。我們以Bonfer-roni法為基礎(chǔ)對R×C列聯(lián)表兩兩比較所得的P值進(jìn)行校正,僅供讀者參考。
【例8- 6】某臨床試驗(yàn)比較兩種新器械與一種常規(guī)器械(A,B,C)對于關(guān)節(jié)痛的治療效 果。將162例關(guān)節(jié)痛患者分為3組,A組56使用常規(guī)器械;B組43倒使用試驗(yàn)器械B;C組 63例使用試驗(yàn)器械C。治療效果見表8-3。對3組優(yōu)劣進(jìn)行兩兩比較。
本資料為結(jié)果變盤為有序變量的單向有序的R×C表資料,分割而成的多個2×4列聯(lián)表 仍為結(jié)果變量為有序變量的二維列聯(lián)表資料。研究3組差異是否有統(tǒng)計學(xué)意義,需采用Wilc-oxon秩和檢驗(yàn)。故在第④步中對程序略作調(diào)整,采用Wilcoxon秩和檢驗(yàn)。 輸出結(jié)果:
輸出結(jié)果的解釋:上面是對原3×4列聯(lián)表資料進(jìn)行兩兩比較的結(jié)果。根據(jù)校正后的P值(即Pj)可知,若以。05水平為基準(zhǔn),第2組與第3組之間療效上的差異有統(tǒng)計學(xué)意義。