關(guān)于司機(jī)年齡與發(fā)生車禍次數(shù)關(guān)系的分析
關(guān)于司機(jī)年齡與發(fā)生車禍次數(shù)關(guān)系的分析
一、 引 言
客觀現(xiàn)象總是普遍聯(lián)系與相互依存的。隨著社會的進(jìn)步,經(jīng)濟(jì)的發(fā)展,交通事故也是頻頻增多,而且有意思的是:發(fā)生車禍的駕駛員中年輕人尤其是21歲以下者所占比例有上升的趨勢,那么車禍次數(shù)與年齡是否必然相關(guān)呢?本文旨在應(yīng)用相關(guān)與回歸的分析方法來對這一問題進(jìn)行研究,在計算各種指標(biāo)時構(gòu)造了回歸模型等來進(jìn)行判定與分析。
全文主要內(nèi)容安排如下:首先提出研究方法與模型檢驗方法,接著在第三部分是對數(shù)據(jù)的描述和簡單的分析,最后對模型進(jìn)行檢驗,得出結(jié)論。
二、 理 論 研 究
各種客觀變量之間的相互關(guān)系可分為兩類:一類是確定性的函數(shù)關(guān)系,另一類是不確定性的統(tǒng)計關(guān)系。研究現(xiàn)象之間的統(tǒng)計關(guān)系時,依研究者的理論知識和實踐經(jīng)驗,可對客觀現(xiàn)象之間是否存在相互關(guān)系以及有何種相關(guān)關(guān)系做出判斷,在定性分析基礎(chǔ)上,可以利用求相關(guān)系數(shù)的方式來判斷兩個或兩個以上變量之間相關(guān)關(guān)系的方向、形態(tài)以及相關(guān)關(guān)系的密切程度。一般求兩個變量相關(guān)系數(shù)r 的方法是;
是變量x, y的樣本協(xié)方差,、分別為變量x, y的樣本標(biāo)準(zhǔn)差。用相關(guān)系數(shù)大小來判斷相關(guān)系數(shù)的密切程度: 表示低度線性相關(guān), 表示顯著性相關(guān), 為高度線性相關(guān)。在確定現(xiàn)象間具有相關(guān)關(guān)系之后,可對其數(shù)量變化的規(guī)律性進(jìn)行測定,確立一個回歸模型,在實際問題中,最簡單的模型是由兩個變量組成的一元線性回歸模型。此時可設(shè)模型的回歸方程為
Y=a+bX+u (x為自變量,y 為因變量,u隨機(jī)擾動項)
根據(jù)最小二乘法知: a=Y–bX
為了判斷兩變量之間是否真正存在顯著的線性相關(guān)關(guān)系,可以求可決系數(shù)進(jìn)行擬合程度評價,也可通過相關(guān)系數(shù)的顯著性檢驗或回歸系數(shù)的假設(shè)檢驗來對所建立的回歸方程式的有效性進(jìn)行分析判斷。
三、實 證 研 究 與 分 析
本文數(shù)據(jù)來源于美國交通部,共采集了每千個駕駛執(zhí)照發(fā)生死亡事故的車禍次數(shù)和有駕駛執(zhí)照的司機(jī)中21歲以下者所占比例的數(shù)據(jù),樣本由42個城市組成,在一年間采集的數(shù)據(jù)如下:
21歲以下所占比例(%) 每千個駕駛執(zhí)照中車禍次數(shù) 21歲以下所占比例(%) 每千個駕駛執(zhí)照中車禍次數(shù) 21歲以下所占比例(%) 每千個駕駛執(zhí)照中車禍次數(shù)
13 2.962 10 0.039 8 1.267
12 0.708 9 0.338 15 3.224
8 0.885 11 1.849 10 1.014
12 1.652 12 2.246 10 0.493
11 2.091 14 2.885 14 1.443
17 2.627 14 2.352 18 3.614
18 3.830 11 1.294 10 1.926
8 0.368 17 4.100 14 1.643
13 1.142 8 2.190 16 2.943
8 0.645 16 3.623 12 1.913
9 1.082 15 2.623 15 2.814
16 2.801 9 0.835 13 2.634
12 1.405 8 0.820 9 0.926
9 1.433 14 2.890 17 3.256
從上表可知每千個駕駛執(zhí)照中,平均發(fā)生車禍次數(shù)為1.92次,即一年內(nèi)每1000個駕駛員中就約有兩次死亡事故發(fā)生。
是什么原因?qū)е氯绱酥叩能嚨湴l(fā)生率呢?與駕駛員中年輕人變多是否有關(guān)呢?下面就采集的`數(shù)據(jù)從以下兩個方面進(jìn)行了探討。
(1)相關(guān)分析:根據(jù)數(shù)據(jù)作出散點圖如下:
從相關(guān)圖中,我們可以看到,21歲以下者所占比例與車禍次數(shù)之間的關(guān)系較為密切,且有線性正相關(guān)的趨勢,進(jìn)一步計算二者的相關(guān)系數(shù),我們可作變量假設(shè):x 為21歲以下者所占比例,y 為每個駕駛執(zhí)照中發(fā)生車禍的次數(shù),則相關(guān)系數(shù)為:
相關(guān)系數(shù)r 為0.835 > 0.7,說明車禍發(fā)生次數(shù)與21歲以下年輕人所占比例有高度的線性相關(guān)關(guān)系
(2)回歸分析
知道了車禍次數(shù)與年輕人比例的高度線性相關(guān)關(guān)系后,我們現(xiàn)在關(guān)心的是二者間的這種關(guān)系能否用一比較好的函數(shù)進(jìn)行描述呢?因此,對其進(jìn)行回歸分析也就尤顯必要,在分析時,我們假設(shè)
① 在簡單的線性回歸模型里,解釋變量無測量誤差;
②模型滿足古典假定。
對其運用OLS對其進(jìn)行回歸得:(表一)
Dependent Variable: Y
Method: Least Squares
Date: 06/09/04 Time: 12:31
Sample: 1 42
Included observations: 42
Variable Coefficient Std. Error t-Statistic Prob.
C -1.591633 0.372128 -4.277110 0.0001
X 0.286745 0.029426 9.744648 0.0000
R-squared 0.703612 Mean dependent var 1.924405
Adjusted R-squared 0.696202 S.D. dependent var 1.070568
S.E. of regression 0.590074 Akaike info criterion 1.829312
Sum squared resid 13.92751 Schwarz criterion 1.912058
Log likelihood -36.41554 F-statistic 94.95816
Durbin-Watson stat 1.724953 Prob(F-statistic) 0.000000
根據(jù)上述變量假設(shè),可作一元線性直線圖如下
可知回歸方程為:Y=0.2867X—1.5916+u,系數(shù)b=0.2867表示在其他條件不變時,21歲以下者所占比例每增加一個百分點,一年內(nèi)每一個駕駛執(zhí)照發(fā)生車禍次數(shù)會增加0.2867次,這顯然是相當(dāng)嚴(yán)重的了。
四、 模 型 的 檢 驗
上述構(gòu)建的模型是否能代表普遍現(xiàn)象呢?還須對回歸模型進(jìn)行一級檢驗。
(1)擬合優(yōu)度評價:
從意義上講,可決系數(shù)與相關(guān)系數(shù)有很明顯的差異,但從數(shù)值上,我們知道可決系數(shù)即為相關(guān)系數(shù)的平方
故可決系數(shù)為: =0.697225
這表明在線性回歸模型中,每千個駕照發(fā)生車禍次數(shù) y 的總變差中,由解釋變量21歲以下者占比例 x 的解釋部分占69.7225%,模型的擬合優(yōu)度較高。
(2)、顯著性檢驗:
首先提出原假設(shè)H0:b =0(總體相關(guān)系數(shù)為零,表示總體的兩個變量線性關(guān)系不顯著),備擇假設(shè)
當(dāng)零假設(shè)H0:b =0成立時,統(tǒng)計量t是服從自由度n-2的t分布,即:
(顯著性水平為=0.05)
實際計算
對給定的,查表得臨界值:
所以拒絕H0,表示總體變量間線性相關(guān)性顯著,即說明車禍次數(shù)與年青人比例之間有顯著的線性相關(guān)關(guān)系,所擬合的線性回歸方程具有95%的置信概率。
(4)、異方差檢驗
運用Goldfeld-Quandt方法檢驗隨機(jī)擾動項是否存在異方差,具體步驟如下:
①將觀察值按解釋變量大小順序排列。
②將排列在中間的約1/4的觀察值刪除掉,除去的觀察值個數(shù)記為C=10,則余下的觀察值分為兩個部分,每個部分的觀察值個數(shù)為(N-C)/2。
③提出檢驗假設(shè),H0:ui為同方差性,H1:ui為異方差性。
④分別對兩部分觀察值求回歸模型,并計算兩部分的剩余平方和=4.813212與=3.727772。他們的自由度均為(n-c)/2-k=14,k=2為估計參數(shù)的個數(shù),于是構(gòu)造
⑤判斷。在給定的顯著性水平=0.05下,=2.5,則接受H0,即誤差項不存在異方差。
(5)、自相關(guān)檢驗
對該模型進(jìn)行最小二乘估計得到DW值約為1.7260,給定顯著性水平=0.05,查Durbin-Watson表,n=42, ,得下限臨界值dL=1.46,上限臨界值du=1.55,因為du=1.55<d=1.762<4-du=2.45, 所以不存在一階自相關(guān)。
五、 結(jié) 論
通過上面的研究可知,車禍的次數(shù)與司機(jī)年齡有著密切的線性正相關(guān)關(guān)系。車禍次數(shù)的增加有69.7225%可由年輕人比例的增加來解釋,那么另外30%由什么解釋呢?因素顯然是多方面的,比如道路設(shè)施不完善,天氣惡劣,酒后駕車,等等,涉及因素甚多,在此就不作詳細(xì)的討論了。由研究結(jié)論我們建議;(1)交管部門采取措施,改善路況,并硬性規(guī)定駕駛員的最低年齡(比如規(guī)定年齡下限為25歲),(2)、司機(jī)朋友們尤其是年輕司機(jī)要警鐘長鳴,小心駕駛,嚴(yán)遵交通規(guī)則。
【關(guān)于司機(jī)年齡與發(fā)生車禍次數(shù)關(guān)系的分析】相關(guān)文章:
2.關(guān)于混凝土材料與混凝土質(zhì)量關(guān)系的分析論文
3.法哲學(xué)與法理學(xué)的關(guān)系分析