傾向值分析對藥物經(jīng)濟學評價的應用論文
傳統(tǒng)的藥物經(jīng)濟學評價多是基于隨機對照試驗(RCTs)來獲得干預的效果和成本數(shù)據(jù)。RCTs的設計原則保證了不同組間可觀測的和不可觀測的影響因素在基線時的可比性。因此,能夠保證獲得對干預效果的無偏估計。但在很多情況下,RCTs是無法實施的,或不能反映真實的治療效果和成本,而基于真實世界研究的藥物經(jīng)濟學評價越來越多。在真實世界研究的觀察性數(shù)據(jù)中,經(jīng)常面臨著患者基線不可比的情況,其產(chǎn)出結(jié)果往往受到各種混雜因素和偏倚的影響,因而無法得到對干預效果的無偏估計。為了消除混雜因素的影響,傳統(tǒng)上會采用多變量配對、多因素回歸和分層分析等方法。但是,這些方法都有其各自的局限性。如當需要匹配的變量很多時,多變量配對通常是不可行的;當混雜因素很多或有多個亞組時,分層分析也是不可行的;多因素回歸則要求不同組間的協(xié)變量具有一致的分布。因此,當可以獲得患者的個人數(shù)據(jù)時,通過特定的統(tǒng)計學方法,如回歸、匹配和工具變量等都可以對混雜因素導致的選擇偏倚進行糾正。在使用這些方法時要注意其相應的假設條件,回歸和匹配的方法需要不存在不可觀測的混雜因素的假定,匹配還需要假定通過匹配后各組間的基線特征能夠得以平衡。傾向值分析是分析觀察性數(shù)據(jù)常用的一類方法,目前也越來越多地用于采用觀察性數(shù)據(jù)開展的藥物經(jīng)濟學評價。
1傾向值分析簡介
在評價干預效應時,很多情況下要利用觀察性數(shù)據(jù)而不是隨機試驗得到的數(shù)據(jù)。在觀察性數(shù)據(jù)的分析中,總是希望能夠重建被打破的隨機試驗的分配原則。傾向值(propensityscore)是在控制其他混雜因素的條件下個體接受干預的概率,對其在干預組和控制組間進行控制或匹配以估計干預效果,可以用來控制大量的混雜因素變量。Rosenbaum和Rubin在1983年發(fā)表了一篇關(guān)于傾向值原理和分析方法的文章[1],之后傾向值分析開始用于勞動經(jīng)濟學和發(fā)展經(jīng)濟學,用來分析通過非隨機試驗方法取得的數(shù)據(jù),近年來越來越多的用于醫(yī)學研究和藥物經(jīng)濟學評價中。在觀察性數(shù)據(jù)中,觀察個體是被分配到試驗組還是控制組并不是隨機的,因而對處理效應的估計會因為混雜因素的存在而產(chǎn)生偏倚。傾向值分析就是用于糾正這一偏倚的方法。通過控制存在的混雜因素,使得試驗組和控制組中的個體在各個維度上盡可能相似,因而減少混雜因素對干預效果估計產(chǎn)生的影響。傳統(tǒng)的配對方法是根據(jù)關(guān)鍵變量對個體進行匹配,對觀測個體在n維變量上進行匹配時,如果n很大,其難度是可想而知的。傾向得分法是將n維變量的信息綜合為一個處理前的單一變量(傾向得分值),從而使匹配更加可行。傾向值分析一般分為兩步,首先是計算一個傾向值得分,然后是根據(jù)這一得分進行匹配(Matching)或分析。對于未采取隨機分組試驗方法得到的數(shù)據(jù),傾向值分析提供了一種近似實驗的方法,產(chǎn)生盡可能隨機分組的效果,以控制觀測變量。如果有兩階段及以上的數(shù)據(jù),還可與雙重差分法(differenceindifferences,DID)合用,控制不隨時間變化的不可觀測變量。
2傾向值分析
用于藥物經(jīng)濟學評價的相關(guān)研究通過對相關(guān)文獻進行綜述發(fā)現(xiàn),傾向值分析已廣泛應用于基于觀察性數(shù)據(jù)的藥物經(jīng)濟學研究中。這些研究所關(guān)注的結(jié)果變量有的只考察成本或效果,或分開檢驗混雜因素對成本和效果的影響。如Manca等[2]應用傾向值分析對不同手術(shù)方案的成本和效果進行研究,通過加拿大安大略湖省的心肌梗死數(shù)據(jù)庫(OMID),對經(jīng)皮腔內(nèi)冠狀動脈成形術(shù)(PTCA)和冠狀動脈旁路移植手術(shù)(CABG)對因急性心肌梗死(AMI)入院患者的成本和效果進行評價。該研究中用到的混雜因素包括患者年齡、性別、心源性休克、急性和慢性腎衰竭、有并發(fā)癥的糖尿病、充血性心力衰竭、腦血管疾病、惡性腫瘤、肺水腫、心律失常、Charlson合并癥指數(shù)和家庭中位收入。對兩組基線協(xié)變量的比較發(fā)現(xiàn),大多數(shù)協(xié)變量存在顯著性差異,即兩組患者的基線信息不平衡。比較的效果是接受治療后1年內(nèi)的生存率,成本是所有疾病相關(guān)的醫(yī)療成本,研究分別對成本和效果未經(jīng)過調(diào)整的結(jié)果、多元回歸結(jié)果、基于傾向值匹配的結(jié)果和基于傾向值分層的結(jié)果進行了比較。也有研究將傾向值分析與其他控制混雜因素的方法進行比較。如Stukel等[3]對使用傾向值與工具變量方法的分析結(jié)果進行了比較。該研究對加拿大1994—1995年全國65~84歲因AMI入院的老年患者是否實施心臟導管介入術(shù)對長期(7年)死亡率的影響。對基線信息分析發(fā)現(xiàn),實施心臟導管介入術(shù)的患者比未實施的患者更加年輕,并且AMI嚴重程度更低。研究分別使用多元回歸、加入傾向值的回歸、傾向值匹配和工具變量的方法進行分析,得到的結(jié)論是多元回歸的結(jié)果與其他方法的結(jié)果相差較大,加入傾向值的回歸和傾向值匹配所得結(jié)果相近,使用工具變量得到的結(jié)果最接近于RCTs的結(jié)果。在該研究中,使用的工具變量是各地區(qū)心臟導管介入手術(shù)的比例,在其他研究中也有使用地區(qū)工具變量的例子,如對AMI患者進行強化治療是否降低死亡率的研究[4-5]。但是,使用工具變量的分析方法通常更適用于對某項政策實施效果的評價,用于分析特定臨床干預時一般并不容易找到合適的工具變量。隨著成本-效果比的統(tǒng)計學評估方法越來越多地應用于藥物經(jīng)濟學研究中,其中凈收益的方法[6]將成本-效果比轉(zhuǎn)化為線性形式,從而提供了可以在回歸模型中估計成本-效果置信區(qū)間的統(tǒng)計學假設檢驗方法。Mitra等[7]將凈效益模型與傾向值分析相結(jié)合,提出了對通過觀察性數(shù)據(jù)對醫(yī)療干預措施進行成本-效果分析的方法。凈效益模型將成本-效果比轉(zhuǎn)化為線性模型,在該線性框架內(nèi)應用傾向值分析可以對基線不平衡的各組間混雜因素進行控制,從而得到干預無偏的估計,但是使用凈效益模型的一個困難是如何確定對λ的取值(也就是每單位效果所對應的意愿支付最大值)。該研究就肌層浸潤性膀胱癌是否行膀胱切除術(shù)的成本-效果進行了分析,將延長的生命時間轉(zhuǎn)化為貨幣單位構(gòu)建凈效益指標,將傾向值對凈效益進行調(diào)整,計算λ取不同值時膀胱切除術(shù)為患者帶來的凈收益,并將該結(jié)果與未經(jīng)調(diào)整的及普通多元回歸調(diào)整的結(jié)果進行比較。研究發(fā)現(xiàn),傾向值調(diào)整的結(jié)果與普通多元回歸調(diào)整的結(jié)果相近,但遠小于未經(jīng)調(diào)整的結(jié)果。
3傾向值分析用于藥物經(jīng)濟學評價的步驟
3.1發(fā)現(xiàn)可能的混雜因素并估計傾向值
傾向值分析的第一步是找出既影響干預分組又影響結(jié)果的混雜因素,將混雜因素作為協(xié)變量估計傾向值。在估計傾向值之前,需要選取合適混雜因素的協(xié)變量。一般協(xié)變量是根據(jù)已有經(jīng)驗或理論依據(jù)來選取的。通過雙變量檢驗,與干預分組變量和結(jié)果變量都相關(guān)的協(xié)變量均應包含在估計傾向值的模型中;與結(jié)果變量相關(guān)的協(xié)變量也應包含在估計傾向值的模型中(不管其與分組變量是否相關(guān)),這樣有助于降低估計結(jié)果的方差;而只與干預分組相關(guān),但與結(jié)果變量無關(guān)的協(xié)變量不應包含在估計傾向值的模型中[8]。得到傾向值后,需要對匹配后的數(shù)據(jù)進行協(xié)變量平衡的檢驗(以干預作為分組進行雙變量檢驗),如果匹配后雙變量檢驗差異無統(tǒng)計學意義,則可得出成功消除觀測協(xié)變量組間差異的結(jié)論;如果協(xié)變量仍不平衡則需要對回歸模型進行重構(gòu)或調(diào)整,常見的調(diào)整方法有加入?yún)f(xié)變量的高階項或交叉項,調(diào)整后再次運行傾向值模型以檢驗匹配的平衡效果;也可通過逐步回歸的方法,在確定的統(tǒng)計學顯著水平下決定納入或排除協(xié)變量。
3.2根據(jù)傾向值進行分析
得到傾向值后,可以利用傾向值作匹配或直接使用傾向值作分析。根據(jù)傾向值進行匹配是將傾向值盡可能相似的干預組成員和控制組成員進行匹配,根據(jù)匹配方法的不同,分為貪婪匹配、采用或不采用傾向值的馬氏距離匹配以及最佳匹配;對于匹配后構(gòu)成的匹配樣本可以進行特定類型的分析,包括基于匹配樣本的分層分析、多元分析及非參數(shù)統(tǒng)計分析。另外,得到傾向值后還可以直接利用傾向值作分析,如將傾向值作為權(quán)重直接做多元分析,或者是基于內(nèi)核的加權(quán)均值差進行分析。3.2.1使用傾向值進行匹配得到估計的傾向值后可以根據(jù)傾向值進行匹配,根據(jù)匹配算法的不同,主要分為貪婪匹配和最佳匹配兩種。使用傾向值做匹配時必須滿足共同支撐架設:兩組在整體上要有相似的特征;兩組傾向得分的重疊區(qū)域成為共同支撐區(qū)域(commonsupportregion),其大小直接影響到匹配的效果。極端情況下,如果兩組沒有共同支撐區(qū)域,說明兩組不具有可比性,在這種情況下,傾向得分匹配的方法就不適用。共同支撐區(qū)域越大,匹配方法的選擇對結(jié)果就不敏感,而共同支撐區(qū)域越小,采用不同的匹配方法所得到的結(jié)果差異就比較大[9]。貪婪匹配是最常用的一種匹配算法,所謂“貪婪”是指這一類匹配都有一個共同特征,每一次匹配的決策都是對當前需要匹配個體而言最優(yōu)的匹配決策,而不考慮總體的匹配效率。因此,這一類匹配通常采用無放回的匹配,每一對最相近的干預組成員和控制組成員在匹配成功后被移出數(shù)據(jù)池,其他成員繼續(xù)重復匹配過程。貪婪匹配的代表有最近鄰匹配(nearestneighbormatching)、卡鉗匹配(calipermatching)、卡鉗內(nèi)的最近鄰匹配(nearestavailableneighbormatchingwithinacaliper)以及馬氏距離匹配(mahalanobismetricdistancematching)。最佳匹配的匹配思想是使得傾向值總體樣本距離最小,要達到的目的是使得匹配的效率達到最高。最佳匹配從總體角度出發(fā),匹配完成后每一個干預組成員與一個或多個控制組成員匹配,按照權(quán)重計算得到干預組與控制組傾向值的.絕對值,最佳匹配使得這些絕對值之和最小。3.2.2匹配后進行分析匹配后首先需要對協(xié)變量的平衡情況進行檢查。有研究[10]對1995—2003年采用傾向值匹配方法進行分析的醫(yī)學文獻的研究質(zhì)量進行了系統(tǒng)綜述,發(fā)現(xiàn)在47篇文獻中只有2篇文獻正確報道了匹配前和匹配后不同組間基線變量的平衡情況,并正確衡量了不平衡的程度。協(xié)變量的平衡可通過均值上的絕對標準化差值來衡量。進行貪婪匹配后可進行多元分析和分層分析?梢栽谄ヅ浜蟮臉颖局心軌蚨嘣貧w分析,以表明干預條件二分類變量的回歸系數(shù)作為干預效果的估計;進行貪婪匹配后,需根據(jù)傾向值進行分層,比較層內(nèi)干預組和控制組的結(jié)果,再根據(jù)各層的結(jié)果均值差和差值的方差估計整個樣本的均值差,并能檢驗其是否統(tǒng)計顯著;進行最佳匹配后可以通過Hodges-Lehmann有序秩檢驗對結(jié)果進行分析,也可通過特殊的回歸調(diào)整來估計[11]。3.2.3不匹配的使用傾向值加權(quán)以上方法是得到傾向值后進行匹配再分析;還可在不匹配的情況下使用傾向值,將傾向值作為抽樣權(quán)重進行多元分析。傾向值加權(quán)的目的在于對干預組和控制組的成員分配權(quán)重,使其能夠代表研究總體?梢詫訖(quán)后的總體直接進行多元分析,也可用于非參數(shù)回歸的傾向值分析,進行基于內(nèi)核的匹配。
3.3對不可觀測的混雜因素做敏感性分析
由于傾向值分析的只能對可觀測的混雜因素進行控制和平衡,而對于不可觀測的混雜因素的影響則無法識別,因此傾向值匹配通常需要通過敏感性分析(sensitivityanalysis)來檢驗是否會存在關(guān)鍵的不可觀測的混雜因素對結(jié)果產(chǎn)生嚴重影響。敏感性分析通過假設存在一個或多個無法控制的不可觀測的混雜因素的存在,假設無法控制的變量對結(jié)果影響在很大范圍內(nèi)的變動都無法改變所得結(jié)論,則認為此研究通過了敏感性檢驗,所得結(jié)論是穩(wěn)健的。傾向值匹配的敏感性分析方法比較常用的是Rosen-baum界限[12],該方法通過一個Г系數(shù)來表示不可觀測混雜因素的可能取值,通過觀察Г在一定水平變動時,結(jié)論不再顯著來判斷結(jié)論對不可觀測混雜因素的敏感性。如果Г取值較小時結(jié)論就不顯著,則所得結(jié)論的穩(wěn)健性值得懷疑;如果Г取值較大時結(jié)論才開始變得不顯著,則認為所得結(jié)論是站得住腳的。
4討論
在對觀察性數(shù)據(jù)進行分析時,傾向值分析是一類直觀、實用的控制混雜因素的方法,已廣泛應用于醫(yī)學、社會學和經(jīng)濟學研究領域中,目前在藥物經(jīng)濟學評價中的應用也越來越多。在開展基于觀察性數(shù)據(jù)的藥物經(jīng)濟學評價時,必須對各組間在基線時的可比性進行評價。對于基線不可比(即存在混雜因素影響)的情況下,需要采用合適的控制混雜因素方法。需要特別注意的是,傾向值分析只能盡量減少混雜因素產(chǎn)生的影響,并不能完全消除,其消除程度取決于可以被觀測和控制的變量數(shù)量以及匹配的質(zhì)量。此外,傾向值分析只能對可觀測的混雜因素進行平衡和控制,并不能夠控制不可觀測的混雜因素,當有重要的混雜因素缺失或不可觀測時,采用傾向值分析所得結(jié)果可能與真實值存在較大偏差,此時如果數(shù)據(jù)允許,應使用工具變量或面板數(shù)據(jù)模型等可以處理不可觀測混雜因素的分析方法。
【傾向值分析對藥物經(jīng)濟學評價的應用論文】相關(guān)文章: