- 相關推薦
薈萃分析(Meta-analysis):潛能和功能
實施良好的薈萃分析可對一個可能導致不確定的和意見不一的結論的證據(jù)給出一個更為客觀的評價。從而防止將有效療法引入臨床實踐過程中不應有的延遲。對大量的具體的研究或具體病人數(shù)據(jù)的薈萃分析,可以驗證關于某一病人亞群的治療效果的先驗假說?蓪Ω鞣N研究結果的異質性進行探索,有時還可作出解釋。還可以生成那些在未來研究過程中有望解決的問題,而且可以準確地計算在研究中所需的樣本大小。在過去的十年中,醫(yī)學研究領域中有關薈萃分析的已發(fā)表的論文數(shù)量急劇
薈萃分析的案例
薈萃分析這一術語對統(tǒng)計學綜合和分析來自獨立研究的數(shù)據(jù)是恰當?shù),因為這個術語有其道理。Meta意指較晚出現(xiàn)的更為綜合的事物,而且通常用于命名一個新的相關的并對原始學科進行評論的學問。而其他術語則既不具體又不確切,例如“綜述”(overview)習慣上也可指傳統(tǒng)的文獻綜述,而“匯總”(pooling)意指源數(shù)據(jù)合并。最近“薈萃分析”一詞被列入醫(yī)學主題詞表和國家醫(yī)學圖書館的Medline檢索系統(tǒng)中。系統(tǒng)性綜述是指應用避免偏差的策略的和針對資料和方法部分的任何形式的回顧。系統(tǒng)性回顧可以包括也可以不包括正式的薈萃分析。
回顧歷史
獨立的研究的合并分析并非最近才有的。統(tǒng)計學家KarlPearson在1904年關于預防傷寒免疫血清的預防效果的報告,可能是運用正式的技術對合并不同樣本的數(shù)據(jù)進行分析的首次報道。而Pearson提出的原理仍然是現(xiàn)在的薈萃分析的主要的理由之一:“若考慮其中可能存在的錯誤,許多觀察組……樣本過小,難以產(chǎn)生任何明確意見!
第一個薈萃分析估計一種治療措施的有效性,發(fā)表于1955年。有趣的是,這種治療為一種安慰劑。對各種差異非常大的條件如術后傷口痛、咳嗽和心絞痛等應用安慰劑的有效性的平均值進行了計算,安慰劑對35%的病人有顯著效果。然而,在十九世紀七十年代在社會科學,尤其在教育研究工作中發(fā)展了更成熟的統(tǒng)計學技術。薈萃分析這一術語由心理學家Glass在1976年杜撰。薈萃分析被心血管病、腫瘤學、圍產(chǎn)期保健領域中的醫(yī)學研究者重新發(fā)現(xiàn)并用于隨機化臨床試驗研究分析。人們也倡導對觀測研究的薈萃分析及“交叉設計合成”(crossdesignsynthesis)(觀測研究數(shù)據(jù)與隨機化臨床試驗的薈萃分析結果的整合)。
后來,一個由臨床醫(yī)師、流行病學家和其他衛(wèi)生專業(yè)人員組成的網(wǎng)絡建立。Cochrane合作組(以醫(yī)學干預評價領域的先驅ArchieCochrane的名字命名)的宗旨是準備、維護和發(fā)布醫(yī)療保健療效的綜合性系統(tǒng)的回顧。自從1992年Cochrane中心在牛津建立以來,這種研究便迅速發(fā)展起來,在歐洲、北美洲和拉丁美洲、非洲和澳洲建立了15個中心以,又有數(shù)以百計的遍布世界各地的個人參與合作。
不受歡迎的統(tǒng)計病態(tài)面孔?
盡管薈萃分析被廣泛應用,但它一直是一項引起爭議的技術。一些擁護者認為“一旦有可能薈萃分析就應取代傳統(tǒng)的單主題的回顧性文章”,其他的人則把它看作是一個“新的禍根”,為一種“不受歡迎的統(tǒng)計病態(tài)面孔”和“應該把它扼殺在搖籃里”。這種接受性的巨大反差并不奇怪。從臨床的角度來看,合并一組具體研究的結果也許并不適合,因為它生成一個群體“平均”治療效果,而臨床醫(yī)師想要了解怎樣才能最佳醫(yī)治他或她的具體病人。對同一問題的薈萃分析可以得出截然相反的結論,如對低分子量肝素防止手術前后血栓形成的評估。及對二線抗風濕病藥物治療風濕性關節(jié)炎的評估。但事情很明顯,為了從先前的研究中獲得最大的收獲,正確的文獻回顧策略應越來越普及及予以高度重視。
敘述性綜述
傳統(tǒng)的敘述性綜述有其不足之處,而薈萃分析似可克服這些缺陷。典型的綜述是主觀的,因此它易引起偏差和誤差。因為沒有正規(guī)的規(guī)則作指導,評論家們可能對一些基本問題產(chǎn)生分歧,如應該包括何種類型的研究,應該如何平衡所獲得的定量證據(jù)。選擇支持作者觀點的內容非常普遍:臨床實驗被引用的頻率與他們所得出的結果有關,與流行觀點相一致的研究比觀點不一致的研究被引用得更頻繁。一旦收集好一組研究,傳統(tǒng)的對研究結果綜述的方法是計算從各方面支持該一論點的研究的數(shù)目,并選擇得到最多認同的觀點。這個步驟無疑是有缺陷的,因為它忽視了樣本大小、作用大小和研究設計。因此難怪應用傳統(tǒng)的方法的分析家們常常得出截然相反的結論,并且往往忽略了微小的,但可能有重要意義的差別。臨床醫(yī)學飽受相反結論之苦,而評論家似乎應有責任去平息這些爭論。然而,在爭論中,從同一證據(jù)實體得出的相反的結論可能與評論家的專業(yè)有關而不是數(shù)據(jù)本身。通過整合實際證據(jù),薈萃分在被檢查的總數(shù)為136個的115個試驗中析可以有更客觀的評價,因此當遇到原始研究、傳統(tǒng)的綜述和編輯意見相左時,薈萃分析可能幫助解決不確定性。
單個研究的局限性
單個研究常常既不能發(fā)現(xiàn)也不能排除兩種療法較小的但與臨床有關的的差異。一個試驗可能顯示無顯著療效,然而事實上療效確實存在,因而可能產(chǎn)生假陰性結果。這是一種II型誤差,對某一治療效果、樣本大小和顯著意義水平的差異,這種誤差的出現(xiàn)的概率可能被計算出。通常I型誤差較好識別——當一個試驗隨機產(chǎn)生顯著差異時,這種誤差的概率反映在P值。一個對報道在試驗組和對照組之間治療無顯著差異的臨床試驗的調查顯示,在臨床研究中出現(xiàn)II型誤差相當普遍:對一個臨床療效的差異,在被檢查的總數(shù)為136個的115個試驗中遺漏這一作用的先驗概率(在某一樣本大小)超過20%。臨床試驗中所包含的病人數(shù)常常不夠充分,這種情況在新近的幾年中幾乎沒有改變。在某些情況下,那些必須的樣本大小仍然很難達到。例如有一種藥物,它能使心肌梗塞的致死風險減少10%,而僅在英國每年就可以延長成千上萬病人的生命。要想測出這種藥物效應并具有90%的確定性(要求II型誤差不得超過10%),那么一個治療組就需1萬多個病人。
為取代如此巨大而昂貴、邏輯解釋又較困難的研究,薈萃分析看來是一個非常吸引人的選擇?衫脦讉較小的但具有可比性的評估相同的或類似的藥物試驗的數(shù)據(jù)。通過這種方法容易獲得所需病人的數(shù)量,并可以按可信度發(fā)現(xiàn)或排除相對較小的藥物效應。
同樣,薈萃分析有助于估計研究結果的普遍性。某些具體研究的發(fā)現(xiàn)可能只有在與該研究人群具有相同特性的病人群體中才有效。如果在不同的病人群體的實驗發(fā)現(xiàn)具有類似結果,那么可以得出結論這種干預的效果具有普遍性。通過集中所有可獲得的數(shù)據(jù),薈萃分析比單個試驗能更好地回答關于一個總體研究結果是否在各個亞群中(如男性病人、女性病人或疾病的嚴重程度不同的對象)存在差異。隨著這一系列文章的討論的展開,這些問題將加以闡明和分析,往往可
【薈萃分析Meta-analysis:潛能和功能】相關文章:
PDF網(wǎng)元防“濫用”功能的分析和同類網(wǎng)元可重用性的研究05-11
中國山水畫的意義和功能04-12
制度的功能06-06
視唱練耳對聲樂技巧的作用和影響分析01-08
我國區(qū)域增長格局和地區(qū)差距的變化與原因分析08-27
分析電力配網(wǎng)管理技術的運行和維護的論文06-20
開放市場中利率平價理論的分析和運用05-12
我國氣壓盤式制動結構性能和前景分析05-11