當臨床試驗到達統(tǒng)計分析階段時,除非在試驗中發(fā)生了出乎預(yù)料的偏倚,否則應(yīng)該預(yù)先在 研究方案中把統(tǒng)訃分析方法確定下來。大多數(shù)情況下,在試驗實施過程中引入的任何大的偏倚,都無法通過統(tǒng)計分析的調(diào)整過程對其進行滿意的調(diào)整。
臨床試驗中數(shù)據(jù)分析所采用的統(tǒng)計分析方法應(yīng)是傳統(tǒng)的、經(jīng)典的統(tǒng)計分析方法,統(tǒng)汁分析 軟件應(yīng)是國內(nèi)外的、經(jīng)過國內(nèi)外權(quán)威機構(gòu)認證的、可再現(xiàn)全部編程過程的統(tǒng)計分析軟件,如SAS0等。
(一)統(tǒng)計分析計劃書
統(tǒng)計分析計劃書由生物統(tǒng)計學家起草,并與主要研究者商定,其內(nèi)容比試驗方案中所規(guī)定的統(tǒng)計分析更為詳細。 統(tǒng)計分析計劃書上應(yīng)列出研究背景、研究目的、統(tǒng)計分析集的選擇、主要指標、次要指標、統(tǒng)計分析方法、療效及安全性評價方法等•并按預(yù)期的統(tǒng)計分析結(jié)果列出宅白的統(tǒng)訃分析表備用。 統(tǒng)計分析計劃書應(yīng)形成于試驗方案和病例報告表完成之后。在臨床試驗實施過程中,可 以進行修改、補充和完善。在盲態(tài)審核時(如適用)可再次進行修改完善。但是在次揭盲 之前必須以文件形式予以確認,此后不能再變動;
(二)數(shù)據(jù)合并與轉(zhuǎn)換
由于臨床試驗法規(guī)(5號令)要求,臨床試驗必須同時在兩家或兩家以上醫(yī)院進行(多中心臨床試驗),因此,研究結(jié)束統(tǒng)計分析時,申辦者除了出具每家醫(yī)院的臨床試驗結(jié)果外,還應(yīng)出 其所有參加醫(yī)院的總的臨床試驗結(jié)果報告。因此,必須將各個研究中心的數(shù)據(jù)進行合并,以便 研究者撰寫臨床試驗總報告。
數(shù)據(jù)合并前必須確認所有研究中心的臨床操作過程都是按照研究方案中所描述的方式進行的,以及檢查各個診斷因素之間是否均衡。有時,某個研究中心得到的數(shù)據(jù)會顯著偏離其他巾心的數(shù)據(jù)。申辦者必須調(diào)查由研究中心造成的所有相關(guān)結(jié)果,并向?qū)徳u單位報告這些情況, 以決定為什么該研究中心會出現(xiàn)不同的結(jié)果。 數(shù)據(jù)變換是為了確保資料滿足統(tǒng)計分析方法所基于的假設(shè),變換方法的選擇原則應(yīng)是公 認常用的。
一些特定變量的常用變換方法已在萊些特定的臨床領(lǐng)域得到成功地應(yīng)用。 統(tǒng)計分析之前對關(guān)鍵變量是否要進行變換,好根據(jù)以前的研究中類似資料的性質(zhì),在試 驗|殳計時就作出決定。擬采用的變換(如對數(shù)、平方根等)及其原理徭住試驗方案巾|兌明。
(三)統(tǒng)計分析人群(數(shù)據(jù)集)
用于統(tǒng)計的分析集需在試驗方案的統(tǒng)計部分中明確定義,并在尚忿審核時確認每位受試 者所屬的分析集。在定義分析數(shù)據(jù)集時,需遵循以下兩個原則:①使偏倚達到小}②控制I類錯誤的增加。 應(yīng)按照意向性分析(intention to treat,ITT)的基本原則,主要療效評價指標的統(tǒng)計分析 應(yīng)包括所有隨機的受試者。
但是,在實際操作中往往很難做到,因此,常采用全分析集進行分析。全分析集(full analysis set,F(xiàn)AS)是指盡可能接近按意向性分析原則的理想的受試者集。 政數(shù)據(jù)集是由所有隨機的受試者中,眥小的和合理的方法剔除后得出的。在選擇全分析集進行統(tǒng)計分析時,對主要療效指標發(fā)生缺失時的估計,可利用接近的一次觀察值進行結(jié)轉(zhuǎn) (last observation carry forward,LOCF)}對缺失數(shù)據(jù)進行截轉(zhuǎn)還存在很多方法.截轉(zhuǎn)時應(yīng)選 擇對結(jié)果相對保守的方法,必要時需提供采用不同結(jié)轉(zhuǎn)有法的靈敏性分析結(jié)果。 受試者的“符合方案集”(per protocol,PP),亦稱為“可評價病例”樣本。E是全分析集的一個子集,這些受試者應(yīng)完成全部試驗,并且其主要療效評價指標沒有嚴重違背研究方案。將受試者排除在符合方案集之外的理由應(yīng)在統(tǒng)計分析報告和臨床試驗報告中寫明。
在確證性試驗中,對器械進行有效性評價時,宜同時用全分析集和符合方案集進行統(tǒng)計分析。當以上兩種數(shù)據(jù)集的分析結(jié)論一致時,可以增強試驗結(jié)果的可信度。當不一致時,應(yīng)對其差異進行細致的討論和解釋。如果從符合方案集中排除受試者的比例太大,則對試驗的總有效性會產(chǎn)生疑問。
全分析集分析法所得到的療效評價是保守的估計,但更能反映以后臨床實踐中的真實情況。應(yīng)用符合方案集可以顯示試驗器械按規(guī)定的方案使用的效果。但可能高估以后臨床實踐中的療效。對于優(yōu)效性研究更傾向參考全分析集的結(jié)果,而列于非劣效或等效研究,則更傾向參考符合方案集的結(jié)果。 對安全性評價的數(shù)據(jù)集選擇應(yīng)在方案中明確定義,通常安全性數(shù)據(jù)集應(yīng)包括所有隨機化后至少有一次安全P土評價的所有受試者。
(四)具體分析方法
統(tǒng)計分析應(yīng)建市在正確、完整的數(shù)據(jù)基礎(chǔ)上,采用的統(tǒng)計模型應(yīng)根據(jù)研究目的、試驗方案 和觀察指標選擇,一般可概括為以下幾個方面。
1.臨床試驗基本情況描述在臨床統(tǒng)計報告的開始,通常用語言或表格剝受試者的參與情況做出總結(jié)。包括各研究組別人選的受試者數(shù)、仝分析集(FAS)對應(yīng)的受試者例數(shù)及占總 人選人數(shù)的百分比、符合方案集(PPS)對應(yīng)的受試者例數(shù)及百分比、、安全集(ss)對應(yīng)的受試 者數(shù)及百分比;整個試驗過程巾,因違背研究方案而被剔除、或者沒能完成研究中途失訪的受 試者,也應(yīng)分別描述其例數(shù)及百分比,并且列明剔除或失訪的具體原兇。 2基線分析不論臨床試驗是否采用隨機的方法,基線觀測值均應(yīng)基于治療前所有患者 的值。
基線數(shù)據(jù)的評價有助于標識治療組問必須均衡的罔素,如病人目前的病情、伴隨用藥、治療、年齡、性別、社會經(jīng)濟狀況、既往病史以及其他可能影響主要終點的因素。對基線數(shù)據(jù)的評價允許選擇及采用使?jié)撛谄行』姆椒?。例如,對那些已知會影響主要終點的因素,呵在分配治療時采用分層或均衡分配的方法。 如果在臨床試驗過程中發(fā)現(xiàn)影響主要終點的因素在兩組間不均衡,則在數(shù)據(jù)分析過程中就應(yīng)該使用調(diào)整或標化的方法來使備組間的不均衡達到小。目前國際上較流行采用傾向性 評分(propensity score)方法進行調(diào)整。 描述參加試驗者的人口統(tǒng)計學資料(如性別、年齡等)及伴隨疾病等,同時,做組間均衡性 檢驗(如為平行組設(shè)計)。
3.期中分析是指正式完成臨床試驗前,按事先制訂的分析計劃,比較處理組間的有效陀和安全性所做的分析。由于期中分析的結(jié)果會對后續(xù)試驗的結(jié)果產(chǎn)牛影響,因此,一個臨床 試驗的期中分析次數(shù)應(yīng)嚴格控制。同時,任何設(shè)計不良的期中分析都可能使研究結(jié)果有誤,所得結(jié)論缺乏可靠性,因此應(yīng)避免設(shè)計不良的期中分析。如進行了計劃外的期中分析,在研究報告巾應(yīng)解釋其必要性,提供可能導致的偏倚的嚴重程度以及對結(jié)果解釋的影響。后,期中分 昕應(yīng)考慮l型誤差膨脹的問題。
4.驗證假設(shè)在開始個詳細的統(tǒng)計分析之前,有必要對預(yù)計的統(tǒng)計分析中使用的假設(shè) 進行驗證。這些假設(shè)包括用于假設(shè)檢驗或估計的概率分布的主要特征;診斷因素在各中心及各組間分布的相似性;咀及騎證變量間可疑的關(guān)聯(lián)(相關(guān)或不相關(guān))。 對統(tǒng)升檢驗中要用到的分布和方差假設(shè)進行驗證是非常重要的。只有當所有假設(shè)被驗證時,此種統(tǒng)計檢驗才能被應(yīng)用。例如,假如假設(shè)服從正態(tài)(高斯)分布,那么應(yīng)對數(shù)據(jù)用適當?shù)?統(tǒng)計方法進行檢驗,以保證數(shù)據(jù)沒有顯著地偏離正態(tài)分布。如果數(shù)據(jù)顯著地偏離了正態(tài)分布,那么就要使用其他的更合適的檢驗方法,比如非參數(shù)方法(自由分布)。 評價各因素在各研究中心以及各對照組間是否平衡也是非常必要的。
任何觀測到的不平 暫都必須進行校正,以保證終進行比較的樣本組間具有可比性。如果需要調(diào)整的變量數(shù)不多,并且要調(diào)整的變量與困變量高度相關(guān),那么協(xié)方差分析將是一種非常有效的調(diào)整工具。但是,如果需要捌整的變量數(shù)很多,要想把所有的變量都調(diào)整得很好,將是一件很困難的事情。 出此,應(yīng)該非常嚴謹?shù)卦O(shè)計和實施臨床試驗,周為希爾( Hill,1967)說過:“如果考慮不周詳,懷著各種僥幸心理開始試驗,寄希望于終的統(tǒng)計分析可以解決各種問題,這種做法必將導致災(zāi)難性的后果。” 如果統(tǒng)計分析時假沒變量是獨立的但實際上變量間是相關(guān)的或不獨立的,則可導致假設(shè)檢驗的重大錯誤。
5.參數(shù)估計、置信區(qū)間估計與假設(shè)檢驗參數(shù)估計、置信區(qū)司估計和假設(shè)檢驗是對主要 指標及次要指標進行評價和估計的必不可少的手段?;旧?,所有的比較分析都要進行假設(shè)檢驗。統(tǒng)計分析報告巾應(yīng)明確地陳述要檢驗的假設(shè)、待估計的處理效應(yīng)、選擇的統(tǒng)計檢驗方法 以及所涉及的統(tǒng)計模型等。處理效應(yīng)的估計應(yīng)同時給出可信區(qū)問,并說明計算方法。假設(shè)檢驗應(yīng)明確說明所采用的是單側(cè)還是雙側(cè),如果采用單側(cè)檢驗.應(yīng)說明理由。
在某些情況下,可應(yīng)用可行的(歷史)數(shù)據(jù)對疾病的進展或其他特征建立數(shù)學模型。臨床 試驗中收集的數(shù)據(jù)可以被用來驗證模型,即通過將模型中的設(shè)定特征與調(diào)查中得到的結(jié)果進 行比較來驗證。這種類型的比較可用來構(gòu)成模型特征的假設(shè)檢驗。
6.協(xié)變量分析除器械本身的作用以外,常常還有其他些因素可影響器械的有效性評價,如受試者的基線情況、不同研究中心之間的差異(中心效應(yīng))等。這些因素在統(tǒng)計學上可作為協(xié)變量處理。在試驗前應(yīng)深思熟慮她識別可能對主要療效指標有重要影響的協(xié)變量及如何 進行分析以提高估計的精度,補償處理組間由于協(xié)變世不均衡所產(chǎn)生的影響。
在多中心臨床試驗中,如果中心間處理效應(yīng)是齊性的,則在模型中常規(guī)地包含交互作用項將會降低主效應(yīng)檢驗的效能。因此對主要指標的分析如果用一個考慮到中心間差異的統(tǒng)計模型來研究處理的主效應(yīng)時,不應(yīng)包含中心與處理的交互作用項。如中心間處理效應(yīng)是非齊性 的,則處理效應(yīng)的解釋是復雜的。
7.療效評價對主要指標及次要指標進行評價和估計的必不可少的手段是進行參數(shù)估 計、可信區(qū)間和假設(shè)檢驗?;旧?,所有的比較分析都要進行假設(shè)檢驗。統(tǒng)計分析報告中應(yīng)明確地陳述要檢驗的假設(shè)、待估計的處理效應(yīng)、選擇的統(tǒng)計檢驗方法以及所涉及的統(tǒng)計模型等。 處理效應(yīng)的估計應(yīng)同時給出可信區(qū)間,并說明計算方法。假設(shè)檢驗應(yīng)明確說明所采用的是單 側(cè)還是雙側(cè),如果采用單側(cè)檢驗,應(yīng)說明理由。 非劣效試驗應(yīng)該使用待估計參數(shù)的點估計及其95%可信區(qū)間來評價。 除器械本身的作用以外,常常還有其他一些因索可影響器械的有效陛評價,如受試者的基 線情況、不同研究中心之間的差異(中心效應(yīng))等。這些因素在統(tǒng)計學上可作為協(xié)變垡處理。
一般來說,對于連續(xù)型主要療效評價指標c如冠脈支架手術(shù)中的晚期管腔丟失等),常使用調(diào)整 中心和基線效應(yīng)的坼方差分析;剝于離散型主要療效評價指標(如成功、失敗等),常使用多元 Logistic回歸分析方法,此時,中心和基線效應(yīng)作為協(xié)變量放在模型中進行調(diào)整。也可使用 CMH X2的方法進行調(diào)整。對于生存分析資料,還可以使用Cox比例風險回歸模型進行調(diào)整。
在某些醫(yī)療器械臨床試驗中,有時由于倫理原因或可行性原因,很難實行隨機馭盲臨床試 驗,因此可能會碰到基線不均衡的研究,此時可使用目前國外流行的傾向性得分法( propensityscore,PS)進行調(diào)整。 因此,在試驗前應(yīng)深思熱慮地識別可能對主要療效指標有重要影響的洳變量及如何進行 分析以提高估計的精度,補償處理組間由于協(xié)變量不均衡所產(chǎn)生的影響。
8.安壘性評價臨床試驗中,安全性評價是非常重要的一個方面。在臨床試驗的早期 (如適用),這一評價主要是探索性的,且只對不良反應(yīng)明顯的表現(xiàn)敏感,在后期,器械的安全性 評價一般通過較大的樣本來更加全而的了解。后期的對照試驗,是一個重要的以無偏的方式探索任何新的、潛在的器械不是反應(yīng)的方法。 為了說明在安全性方面與其他器械比較的優(yōu)效性或等效性,可設(shè)計某些試驗,這種評價需要相應(yīng)的確證性試驗的支持,這與相應(yīng)的有效性評價的要求是相同的。 器械安全性評價的常用統(tǒng)計指標為不良事件發(fā)生率和不良反應(yīng)發(fā)生率。
對于試驗時間較長、有較大的退出治療比鍘或死亡比例時,需用生存分析計算累計不良事件發(fā)生率。用于評價 器械安全性的方法以及度量準則依賴于非臨床研究和早期臨床研究的信息、器械使用方法、受試者類型以及試驗的持續(xù)時問等。而構(gòu)成安全性評價的資料則主要來源于臨床不良事件、實驗室檢查(包括臨床化學、血液學)及生命指征等。 從受試者中收集的安全性變量應(yīng)盡可能全面,包括受斌者出現(xiàn)的所有不良事件的類型、發(fā)生時間、嚴重程度、處理措施、持續(xù)的時間、轉(zhuǎn)歸及是否認為與試驗器械有關(guān)等。 所有的安全性指標在評價中都需十分重視,其主要分析方法需在研究方案中指明。所有 的不良事件均需報告,無論是否認為與試驗器械有關(guān)。
在評價中,研究人群的所有可用資料均需說明。實驗室應(yīng)提供檢查指標的度量草位以及參考值范圍等。 在大多數(shù)的臨床試驗中,對安全性的評價常采用描述性統(tǒng)計分析方法進行。
(五)統(tǒng)計分析報告
為了給主要研究者撰寫臨床試驗總結(jié)報告提供素材,在統(tǒng)計分析結(jié)束后,生物統(tǒng)計學專業(yè) 人員應(yīng)寫出統(tǒng)計分析報告。 統(tǒng)計分析報告由文字、統(tǒng)計圖和統(tǒng)計表格組成,一般包括如下內(nèi)容:臨床試驗的目的、研究 設(shè)計、隨機方法、對照組的選擇、是否雙盲、主要(次要)療效評價指標的定義、統(tǒng)計分析數(shù)據(jù)集的定義等。其次對統(tǒng)計分析報告中涉及的統(tǒng)計模型,應(yīng)準確而完整地予以描述,如選用的統(tǒng)計 分析軟件、統(tǒng)計描述的內(nèi)容、對檢驗水準的規(guī)定、以及進行假設(shè)檢驗和建立可信區(qū)間的統(tǒng)計學方法。如果統(tǒng)計分析過程中進行了數(shù)據(jù)轉(zhuǎn)換,應(yīng)同時提供選擇數(shù)據(jù)轉(zhuǎn)換的基本原理。
統(tǒng)計分析結(jié)論應(yīng)用精確的統(tǒng)計學術(shù)語予以闡述。后,按照統(tǒng)計分析計劃書設(shè)計的統(tǒng)計分析表格詳 細描述統(tǒng)計分析結(jié)果。 對器械進行有效性評價時,應(yīng)給出每個觀察時間點的描述性統(tǒng)計分析結(jié)果。列出檢驗統(tǒng)計量、P值。例如,兩個樣本的£檢驗的結(jié)果中應(yīng)包括每個樣本的數(shù)量、均值、標準差、中位數(shù), 小值、大值、兩樣本比較的f值和尸值。用方差分析進行主要指標有效性分析時,至少應(yīng)包括各中心的均值和標準差,考慮各種治療囂械、各中心和基線值的協(xié)方差分析表。
對于交叉 設(shè)計資料的分析,應(yīng)包括治療器械順序資料、每個階段開始時的基線值、洗脫期及洗脫期長度、 每個階段中的脫落情況、還有用于分析治療、階段、治療與階段的交互作用方差分析表。器械 的安全性評價,主要以描述性統(tǒng)計分析為主,包括使用器械情況(使用器械持續(xù)時間等)、不良 事件發(fā)生率及不良事件的具體描述(包括不良事件的類型、嚴重程度、發(fā)生及持續(xù)時間、與試驗器械的關(guān)系等);實驗室檢驗結(jié)果在試驗前后的變化情況;發(fā)生的異常改變及其與試驗用器械 的關(guān)系及隨訪結(jié)果等。
總之,統(tǒng)計分析報告是非常重要的,是主要研究者撰寫臨床試驗總結(jié)報告的基礎(chǔ),也是器械上市報批審砰的基礎(chǔ)。