資訊
頻道
當前位置:首頁 > 醫(yī)療器械資訊 > 行業(yè)資訊 > 非診斷試驗中的多重比較----定性資料的多重比較

非診斷試驗中的多重比較----定性資料的多重比較

文章來源:yappets.com發(fā)布日期:2013-06-19瀏覽次數:28403

        對于結局變量為定型變量的多個平行組設計,兩兩比較的方法有很多種,這里著重介紹 R×2、R×C列聯表資料兩兩比較的些方法,并給出一些SAS程序供讀者參考。

        (一)R×2列聯表資料的兩兩比較
        R×2列聯表資料的兩兩比較也稱率的多重比較,可分為各試驗組與對照組的比較和全部組間的兩兩比較。前者可分析各試驗組與對照組之間頻數分布的差異有無統(tǒng)計學意義,后者 可分析任意兩組間頻數分布的差異有尤統(tǒng)計學意義。若直接采用多次2×2列聯表資料的Z2檢驗或Fisher精確檢驗來進行R×2列聯表資料的兩兩比較,將會明顯增大犯假陽性錯誤的概率。幽此,統(tǒng)計學界提出了一些校正的方法,目前已有30種之多,下面簡要介紹一些常用的兩兩比較方法。

        1.調整顯著性水準

        (l)各試驗組與對照組之間的比較:般采用Brunden法•它是由M .N.Brundcn于1972年提出的,其顯著性水準的計算公式為:

        式中α’為調整后的顯著肚水準,并以它作為評價各試驗組i與劉照組之間的差異是否有統(tǒng)計學意義的共同顯著性水準。α為研究者規(guī)定的一般絲著眺水準,常為0 05或0 01。^為樣本率的個散,即列聯表資料的行數。如對于一個5×2的州聯表資料,它有4個試驗組和1個對照組,在統(tǒng)計分析后認為5個組間的頻數分布不完全相同時,欲進一步研究哪砦試驗 組與對照組的頻數分布不同,需進行4次試驗組與對照組的比較。所以,k = 5,而需要比較 的次數為k-1=4.調整后的顯著性水準就變?yōu)閍/[2×(5—1)],即α/8。需要說明的是,由該方法估計的檢驗水準α’可以使研究者犯假陽性錯誤的概率人大降低,但另一方面,該檢驗水準也比較保守
        (2)各組間的兩兩比較:調整各組間兩兩比較的顯著陛水準應用較為廣泛的有兩種力法, 分別是Bonferroni和Sidak方法。 Bonferroni方法是通過將兩兩比較所獲得的P值乘以一定的倍數(兩兩比較的次數)來實 現對兩兩比較原始P值的校正。設校正后的P值為P’.某一分表假設檢驗獲得的P值仍記 為P,兩者之間的關系可表示如下:

        Sidak方法通過另一種方法對兩兩比較所獲得的P值進行修正。設校正后的P值為P’ 某一分表假設檢驗獲得的P值仍記為P,兩者之間的關系可表示如下:


 

        其中n為兩兩比較的次數,其計算公式同(8-31)
        與Bonferroni方法類似,這也是修正兩兩比較似駛檢驗所得的P值,更常用的做法則是修正臨界水準。設α’為調整后的顯著性水準,并以它作為評價各組間的兩兩比較的共同顯著性水準。α為研究者規(guī)定的一般顯著性水準,則α’與α的關系可表示如下:

        Sidak方法與Bonferroni方法類似,區(qū)別在于它們修正P值或顯著性水準α的汁算方法略有差異。前者通過汁箅多次兩兩比較后犯假陽性錯誤概率的理論值1(1 -α’)n,并使1-(1 -α’)n控制在原本設想的假陽性錯誤概率α之內來實現的,后者是通過控制多擻兩兩比較的假陽性錯誤概率之和在原本設想的假陽性錯誤概率α之內來實現的。理論上來講,前者更為精確,可從理論上進行推導獲得,后者更大程度上是一種經驗上的簡便算法。兩者的差異不 是很犬,讀者可根據實際需要選用,若上述兩種方法的假設檢驗結果存在矛盾,建議讀者多采 用一些兩兩比較的方法進行檢驗并結合臨床專業(yè)情況來決定取何種結果。

        2.基于重復抽樣的1300tst rap方法或Permutation方法 SAS的Multtest過程(即多重檢驗過程),提供了兩種方法來進行各試驗組與對照組的比較或各組間的兩兩比較,即Boot-strap(自助法)和Permutation(置換法)方法,這兩種方法均基于重復抽樣。Bootstrap和Permutation分別用有放回和無放回的方法對數據進行重抽樣,來逼近所有檢驗中小P值的分 布,然后用該分布對單個原始P值進行修正。

        【例8-4】某臨床試驗研究使用3種理療儀對治療膝關節(jié)疼痛的治療效果,同時設立常規(guī)器械作為對照組,治療結果見表8-2?,F已經過統(tǒng)計分析得出各組間改善率不完全相同,需進 一步研究哪些試驗組與對照組之間改善率的差異存在統(tǒng)計學意義。

        SAS程序及說明,SAS程序見CT8-4

 

        裎序中第①步為創(chuàng)建兩兩比較的宏,包含兩個宏參數:數據集名稱dataset和列聯表行數a(即組數),在調用這個宏時需要給出這兩個宏參數的值。第②步為創(chuàng)建兩個表,分別包含對比組名稱和對比結果P值(見第⑤步),用來幫助輸出后兩兩比較的結果。第③步為將原 R×C表分割成由每一個試驗組分別與對照組構成的2×2表。第④步為對每個分割表進行 Fisher精確檢驗,并將相應的P值輸出。因為此宏對每一個2×2列聯表都執(zhí)行相同的統(tǒng)計 檢驗,所以建議讀者僅當所有分割出來的2×2列聯袤都滿足一般χ2檢驗的應用條件時,才能用χ2檢驗替代本步內的Fisher精確檢驗。否則,都采用Fisher精確檢驗即可。此步中的首行“ods listing close;”及尾行“ods listing;”調用了SAS輸出傳送系統(tǒng)(output delivery system).目的是在結果中不輸出對每個分割表的統(tǒng)計分析結果。若讀者認為需要每個分割表的 統(tǒng)計分析結果,可將此兩句同時刪除。第⑤步為將對比組名稱插入pTestl襄中,將對比結果P值插入pTest2表中,此步驟與第二步相呼應。第@步為將pTestl和pTest2兩個表合并,使后輸出的統(tǒng)計分析結果簡單清晰。第⑦步為采用Brunden法對每一個分割表處理所獲 得的Fisher精確檢驗的P值進行修正。第⑧步為將兩兩比較的結果輸出,同時調用SAS輸 出傳送系統(tǒng)將結果輸出為html格式。第⑧步為創(chuàng)建數據集。第⑩步為宏rc輸入兩個宏參數 的值,數據集名稱為CT84,列聯表行數為4,即調用宏。 輸出結果:

        輸出結果的解釋:以上是4×2列聯表各試驗組與對照組兩兩比較的結果,第2列“com-pare”給出了進行比較的組別,第3列“P”為對分割表進行Fisher精確檢驗的雙側尾端概率值,第4列“PJ”是采用Brunden法校正后的P值,滇者在下統(tǒng)計結論時應以此列為準。從上 面的結果中可以看出,若以0. 05水平為基準,第4組(第3試驗組)與第1組(對照組)之間改 善率的差別具有統(tǒng)計學意義。 R×2列聯表資料中,各試驗組與對照組之間的兩兩比較也可以通過SAS的Multtest過 程來實現,SAS程序及結果如下。 SAS程序及說明:SAS程序見CT85。

        笫①步為創(chuàng)建數據集,需要注意的是結果變趕的取值必須為O或1,這是接下來要調用的Multtest過程規(guī)定的,但其賦值順序(既0,l或l,0)不影響終的結果。第②步調用Multtesi過程,采用permutation方法(或采用bootstrap方法,兩者的區(qū)別在于重抽樣是否為有放回抽樣)來修正P值,需要設定樣本量nsample和隨機種子數seed,nsample表示采用permuta-tion或bootstrap時所使用的重抽樣次數,缺省值為100,seed為規(guī)定一個正整數作為重抽樣 的隨機數發(fā)生器的初始種子,缺省值為計算機時鐘值。Test語句后規(guī)定檢驗統(tǒng)計量,做R×2列聯表的多重比較在這里只能選用Fisher精確檢驗,因為Multtest過程不提供χ2檢驗。 Fisher(*)中,“*”代表結果變量,class后接原因變量。contrast語句后規(guī)定需要進行比較的組,只能為-1.0,1 3個取值,其中取值為l的組被合并,取值為-l的組授合并,兩合并組進 行比較,取值為0的組不參與比較。本例中,統(tǒng)計分析的目的是進行兩兩比較,所以每次只有 一個取值為1的組和一個取值為-l的組之間的比較,不會合并組然后進行比較。第③步將 兩兩比較的結果輸出。
 

 

        注意:對1一這種一個對照組與多個試驗組進行兩兩比較的情況,采用MullIest過程,可不 必寫出contrast語句,SAS自動生成所有試驗組與對照組的對比,但必須在SAS數據步中將 對照組的數據首先錄入,因為SAS默認class后的變址的水平為對照組。此外,對于所有 組間的兩兩比較則不能缺省contrast語句,必須將需要對比的所有組一一列出。 輸出結果:

        輸出結果的解釋:以上足采用SAS的Multtest過程獲得的4×2列聯表各試驗組與對照組兩兩比較的結果。其中,第9列“raw_P”是劃分割喪進行Fisher精確檢驗的雙側尾端概率值,第10列“perm_P”是采用permutation方法對數掘進行重抽樣后估計的P值,讀者在下統(tǒng)計結論時應以此剮為準。從L面的結果中可以看出,若以0.05水平為基準,則組號第心組(即對照組與試驗第3組)之問改善率的差異有統(tǒng)計學意義。

        【例8 5】使用【例8-4】的數據,現已經過統(tǒng)計分析得出各組間改善率不完牟相同,對四組(3個試驗組,1個對照)之間進行兩兩比較,分析每兩組改善率的差異是否存在統(tǒng)計學 意義。 SAS裎序及說明:SAS程序見CT8 -6。


 

        此程序與例8-4中個SAS程序基本相同,區(qū)別只有兩處。處為第②步與第③步 之間的do循環(huán)語句,例17-2個SAS程序中此位置的do循環(huán)語句是為了將R×2列聯表 分割成由每一個試驗組分別與對照組組合而成的多個2×2列聯表,而本例的do循環(huán)語句是 為了將R×2列聯表分割成任意兩個組都分別進行組合而成的多個2×2列聯表。另外第⑦ 步中修正P值的方法也不相同,例8 4采用Brunden法修正P值,而本例采用Bonferroni法 修正P值。其他步驟的SAS程序實現目的與例8-4中個SAS程序相同。 輸出結果:

        輸出結果的解釋:以上是4×2列聯表各組兩兩比較的結果,第2列“compare”給出了進行比較的組別,第3列“P”為對分割表進行Fisher精確檢驗的雙側尾端概率值,第4列“Pj”是采 用Bonferroni法校正后的P值,讀者在下統(tǒng)計結論時應以此列為準。從上面的結果中可以看 出,第1組與第4組(對照組與試驗3組)、第3組與第4組(試驗2組與試驗3組)改善率差別 具有統(tǒng)計學意義。 
        R×2列聯表資料中,各組之間的兩兩比較也可以通過SAS的Multtest過程來實現,SAS程序及結果如下。

        輸出結果的解釋:以上是采用SAS的Multtest過程獲得的9×2列聯表各組兩兩比較的結果。其中,第8列“raw_P”是對分割表進行Fisher精確檢驗的雙側尾端概率值,第9列 “perm_P是采用Permutation方法對數據進行螢抽樣后估計的P值,下統(tǒng)計結論時應以此列為準。第1組與第4組(對照組與試驗3組)、第3組與第4組(試驗2組與試驗3組)改善率 差別具有統(tǒng)計學意義。

        (二)R×C列聯表資料的兩兩比較
        與R×2列聯表兩兩比較不同,R×C列聯表兩兩比較目前研究并不多。我們以Bonfer-roni法為基礎對R×C列聯表兩兩比較所得的P值進行校正,僅供讀者參考。

        【例8- 6】某臨床試驗比較兩種新器械與一種常規(guī)器械(A,B,C)對于關節(jié)痛的治療效 果。將162例關節(jié)痛患者分為3組,A組56使用常規(guī)器械;B組43倒使用試驗器械B;C組 63例使用試驗器械C。治療效果見表8-3。對3組優(yōu)劣進行兩兩比較。

        本資料為結果變盤為有序變量的單向有序的R×C表資料,分割而成的多個2×4列聯表 仍為結果變量為有序變量的二維列聯表資料。研究3組差異是否有統(tǒng)計學意義,需采用Wilc-oxon秩和檢驗。故在第④步中對程序略作調整,采用Wilcoxon秩和檢驗。 輸出結果:

        輸出結果的解釋:上面是對原3×4列聯表資料進行兩兩比較的結果。根據校正后的P值(即Pj)可知,若以。05水平為基準,第2組與第3組之間療效上的差異有統(tǒng)計學意義。