- 相關(guān)推薦
科研論文寫作常見的統(tǒng)計學(xué)問題
隨著醫(yī)學(xué)科研工作的深入,醫(yī)學(xué)統(tǒng)計學(xué)的應(yīng)用越來越廣泛,下面是小編搜集整理的科研論文寫作常見的統(tǒng)計學(xué)問題,供大家閱讀參考。
未交待清楚所用統(tǒng)計學(xué)方法
論文中所用的統(tǒng)計方法應(yīng)在最后交待清楚。使用不正確的統(tǒng)計方法會得出錯誤的結(jié)論,所以統(tǒng)計方法交待不清或根本不予交待,會使讀者對論文結(jié)論的正確與否無法判斷。有的作者只提一句“經(jīng)統(tǒng)計學(xué)處理”后就寫出結(jié)論,有的甚至于直接用P值說明問題了事。正確的做法應(yīng)寫明具體的統(tǒng)計方法,如有特殊情況,還應(yīng)說明是否采用了校正,這樣才有說服力。嚴(yán)格地說,應(yīng)寫明精確的統(tǒng)計量值和P值,如t值、F值、χ2值等,不應(yīng)籠統(tǒng)地以P>0.05或P<0.05代替。此外,最好能交待所使用的計算工具與統(tǒng)計軟件名稱。
不考慮統(tǒng)計方法應(yīng)用條件
每一種統(tǒng)計方法都有其適用條件。
在表示計量資料的平均水平時常用到平均數(shù)。然而平均數(shù)有算術(shù)平均數(shù)、幾何均數(shù)和中位數(shù),各有其應(yīng)用條件。應(yīng)用均數(shù)時,必須首先確定數(shù)據(jù)為正態(tài)分布。如果數(shù)據(jù)是偏態(tài)分布,仍用均數(shù)表示其平均水平勢必導(dǎo)致錯誤的結(jié)論。對于偏態(tài)分布的數(shù)據(jù),應(yīng)該用幾何均數(shù)或中位數(shù)表示其平均水平。
t檢驗要求樣本來自正態(tài)總體,作兩樣本均數(shù)比較時還要求方差齊。如果不符合這些條件,則應(yīng)考慮進(jìn)行數(shù)據(jù)轉(zhuǎn)換或用非參數(shù)檢驗;當(dāng)兩小樣本均數(shù)比較方差不齊時,可采用t檢驗。例如臨床研究中常涉及病人的病程,有的論文中病程5d至24年的平均水平和離散度為(311±613)年,這種標(biāo)準(zhǔn)差接近或大于均數(shù)的數(shù)據(jù)顯然屬于嚴(yán)重的正偏態(tài),直接進(jìn)行t檢驗,無疑是錯誤的。t檢驗不能用于三組或三組以上的組間比較,即使資料符合t檢驗的條件也是不行的。因為一則將原來的多組整體設(shè)計割裂,失去了總變異和總剩余誤差,與原設(shè)計思想不符;二則損失了部分信息,降低了檢驗效率。
對于三組或三組以上組間的均數(shù)或分布的比較可以用以下方法:
(1) 如果各樣本來自正態(tài)總體,且方差齊,可用方差分析;
(2) 如果各樣本來自正態(tài)總體,但方差不齊,則可作數(shù)據(jù)轉(zhuǎn)換,待方差齊后再用方差分析;
(3) 如果各樣本分布不清或分布不明,則可考慮用秩和檢驗。
在t檢驗中,把配對設(shè)計的資料作成組比較的t檢驗,是常見的失誤之一。有的作者誤將配對數(shù)據(jù)分為兩個獨立的組,分別設(shè)計兩組各自的均數(shù),并按兩組均數(shù)作成組比較的t檢驗。這樣使原來只有差值之間的變異擴大為“兩個樣本”各自的變異,錯誤地增大了標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤差,同時樣本含量也從原來的對子數(shù)變成了“兩個樣本”的例數(shù)之和。其結(jié)果大多使t檢驗所得P值增大,可導(dǎo)致差異從有統(tǒng)計學(xué)意義變?yōu)闊o統(tǒng)計學(xué)意義。
卡方檢驗中的計算公式較多,各有其適用條件,稍有不慎,即有誤用的可能,應(yīng)根據(jù)實驗設(shè)計和資料性質(zhì)進(jìn)行正確選擇。
常見的失誤是:
(1) 四格表資料,當(dāng)140時,沒有計算校正χ2值;
(2) 四格表資料,當(dāng)T<1或n<40時,沒有選用四格表確切概率法;
(3) 行×列表資料,由于例數(shù)太少,致理論頻數(shù)太小,沒有采有適當(dāng)?shù)奶幚矸椒?而是直接計算χ2值,導(dǎo)致分析的偏性。例如兩組共計15例,就不宜用一般的卡方檢驗公式計算,應(yīng)該使用確切概率法。
統(tǒng)計學(xué)基本概念不清
在作統(tǒng)計推斷時,對樣本例數(shù)有一定的要求,一般認(rèn)為,樣本例數(shù)太少,所得到的數(shù)值不穩(wěn)定,不能輕易下結(jié)論。
統(tǒng)計學(xué)上,三組或以上的比較稱為一攬子比較,在作這種比較時,應(yīng)先將所有的組一起比較。在得出差別有統(tǒng)計學(xué)意義的基礎(chǔ)上,再進(jìn)一步作兩兩比較或多個處理與同一對照組比較。論文中常見的錯誤是將三組或以上組拆開分別作兩兩比較。正確的方法是:定量資料在方差分析P<0.05后,再用Q檢驗或Dunnett法作兩兩比較;定性變量在R×C表資料χ2檢驗P<0.05后,再作χ2分割法分析。
對于有序分類資料(即等級資料)的統(tǒng)計處理,在比較各處理組的效應(yīng)有無差別時,宜用秩和檢驗、Rid2it分析或交叉積差法及等級相關(guān)法,但有些作者則誤用卡方檢驗,此時作卡方檢驗只能說明各處理組的效應(yīng)在構(gòu)成比上有無差異。
對于“率”與“比”的概念不清,會導(dǎo)致將構(gòu)成比誤認(rèn)為是發(fā)病率、患病率、死亡率。這三種率均為疾病統(tǒng)計指標(biāo),要做人群的流行病學(xué)調(diào)查才能得到。在臨床療效研究中,一般無法計算出這三種率。
相關(guān)回歸分析
相關(guān)分析是分析自變量x與因變量y的關(guān)系,醫(yī)學(xué)領(lǐng)域里完全相關(guān)(相關(guān)系數(shù)r=1或-1)的事件極少。
有作者將一組變量既作為自變量又作為因變量,r=1,認(rèn)為有完全相關(guān)性,這說明對相關(guān)的概念還不十分清楚。不能把相關(guān)、回歸關(guān)系直接看作因果關(guān)系。兩事物間有數(shù)量關(guān)系,可能是因果關(guān)系,也可能不存在因果關(guān)系,而僅僅是伴隨關(guān)系。
如果求得了兩個變量間數(shù)量關(guān)系的回歸方程式,或算出了r,在做結(jié)論之前,應(yīng)先作統(tǒng)計檢驗;若P>0.05,此回歸方程并無實際意義。r的實際意義如何,還要看r絕對值的大小,因r的統(tǒng)計學(xué)檢驗,不論P值多么小,只能提供兩個變量是否相關(guān)的信息,卻不提供相關(guān)是否密切的信息。相關(guān)的密切程度常以r的數(shù)值大小為指標(biāo)。r的絕對值越接近于1,兩變量的相關(guān)關(guān)系越密切;越接近0,越不密切。r的平方即r2(決定系數(shù))也可表示因變量y與自變量x的關(guān)系密切程度,如果r2=0.22 =0.04,說明因變量y的變異中僅有4%與x有聯(lián)系;此時若P<0.01,仍不能認(rèn)為兩者“明顯相關(guān)”。
統(tǒng)計說法不嚴(yán)格
統(tǒng)計學(xué)上對差異作是否有顯著性意義的推斷與日常生活中對差異作是否顯著的推斷完全是兩個概念。主觀感覺兩個樣本均數(shù)間的差異并不顯著而統(tǒng)計學(xué)上作出差異有顯著意義的推斷,主觀感覺兩個樣本均數(shù)間的差異很大而統(tǒng)計學(xué)作出其間差異無顯著意義的推斷都是有可能的。既往所用的“差異顯著”、“差異非常顯著”等字句,容易與日常生活判斷的字句相混淆,故現(xiàn)在一般認(rèn)為用“差異有或無統(tǒng)計學(xué)意義”較為清楚明白。
對于假設(shè)檢驗的結(jié)果,不僅要恰當(dāng)?shù)慕忉、正確地分析,還要準(zhǔn)確地予以表達(dá)。差異有無統(tǒng)計學(xué)意義,在檢驗水準(zhǔn)α=0.05時,一般是以P>0.05或P≤0.05為界線,有作者的結(jié)果為P>0.01,由此判斷差異無統(tǒng)計學(xué)意義,但P>0.01不一定就是P>0.05,也可能0.010.01同時也>0.05,才能判斷為差異無統(tǒng)計學(xué)意義。還有作者的假設(shè)檢驗結(jié)果為P=0.100000,雖然不能說是錯誤,可是不符合習(xí)慣用法。
數(shù)據(jù)統(tǒng)計不準(zhǔn)確
文內(nèi)所給出的各種數(shù)據(jù)及統(tǒng)計要準(zhǔn)確無誤,不能前后有別。有論文的文題是45例患者,而在統(tǒng)計表中相加為47例,但討論中又說是46例,究竟是多少例患者似乎論文作者自己也說不清,只好退修。對于相對數(shù),當(dāng)例數(shù)較少時,一定要有相應(yīng)的絕對數(shù),如有的組只有4例,治愈2例,即報道治愈率為50%,這顯然是不妥的。在計算構(gòu)成比或有些率時,一定要注意合計必須是100%,有的時候因為四舍五入,合計為99.18%或100.11%,此時要作調(diào)整。嚴(yán)格地說,要按有效數(shù)字的運算法則“四舍六入,逢五前位奇進(jìn)偶舍”計算。數(shù)據(jù)錯誤多,說明作者缺乏嚴(yán)肅認(rèn)真的科學(xué)態(tài)度。
統(tǒng)計表不規(guī)范
統(tǒng)計表的設(shè)計合理與否,對論文的質(zhì)量和科學(xué)性有重大的影響。統(tǒng)計表存在的問題主要有:
(1) 表題過于簡略,甚至不寫表題;或過于繁瑣以及標(biāo)題不確切;
(2) 標(biāo)目過多,層次不清;
(3) 線條過多;
(4) 表內(nèi)同一指標(biāo)的小數(shù)位數(shù)不一致。
表題應(yīng)扼要說明統(tǒng)計表的內(nèi)容, 一般不宜超過15個字。橫標(biāo)目說明各橫行數(shù)字的涵義,縱標(biāo)目說明各縱列數(shù)字的涵義,必要時在橫、縱標(biāo)目上可冠以總數(shù)目。通常把主語置于橫標(biāo)目,謂語置于縱標(biāo)目。表的線條宜少勿多,常用三線表;除頂線、底線以及隔開縱標(biāo)目與數(shù)字的橫線外,其余線條均可省去,絕對不要用豎線,特殊情況下加輔助橫線。表內(nèi)數(shù)字一律用阿拉伯?dāng)?shù)字,同一指標(biāo)的小數(shù)位數(shù)應(yīng)一致,位次對齊。統(tǒng)計表強調(diào)以最小的篇幅說明最多的問題,避免一切不必要的線條與數(shù)字、符號和腳注,力戒繁瑣,且勿堆累。若用簡潔的文字已能說明問題,則盡量不用表。如用了統(tǒng)計表,則文中不宜再完全重復(fù)其數(shù)據(jù),只需強調(diào)或描述其主要發(fā)現(xiàn)。同一資料,還要避免統(tǒng)計表與統(tǒng)計圖之間的重復(fù)。
【科研論文寫作常見的統(tǒng)計學(xué)問題】相關(guān)文章:
醫(yī)學(xué)論文寫作的常見問題11-18
sci論文寫作常見問題剖析03-22
SCI論文寫作發(fā)表常見問題03-15
科研論文的寫作要求03-25
科研論文寫作的技巧07-20
科研論文寫作格式要求08-30
醫(yī)學(xué)論文的常見問題11-20
論文答辯的常見問題11-24
論文答辯時常見的問題04-10