預(yù)防醫(yī)學(xué)/回歸分析
醫(yī)學(xué)電子書 >> 《預(yù)防醫(yī)學(xué)》 >> 相關(guān)回歸分析 >> 回歸分析 |
預(yù)防醫(yī)學(xué) |
|
醫(yī)學(xué)上,不少孌量間雖存在一定關(guān)系,但這種關(guān)系不象函數(shù)關(guān)系那樣十分確定。例如正常人的血壓隨年齡而增高,但這只是總的趨勢,有些高齡人的血壓卻不一定偏高;一群正常人按年齡和血壓兩個變量在坐標(biāo)上的方位點,并非集中在一條上升直線上,而是圍繞著一條有代表性的直線上升。
直線回歸分析的任務(wù)在于找出兩個變量有依存關(guān)系的直線方程,以確定一條最接近于各實測點的直線,使各實測點與該線的縱向距離的平方和為最小。這個方程稱為直線回歸方程,據(jù)此方程描繪的直線就是回歸直線。
(一)直線回歸方程式(linear regression equation)的計算
直線回歸方程的通式為:
=a+bX 公式(22.3)
式中Y為自由變量X推算因變量Y的估計值,a為回歸直線在Y軸上的截距,即X=0時的Y值;b為樣本回歸系數(shù)(regression coefficient),即回歸直線的斜率(slope或稱坡度),表示當(dāng)X變動一個單位時,Y平均變動b個單位。如果已知a與b,用以代入公式(22.3),即可求得直線回歸方程。求a和b的公式分別為:
公式(22.4)
公式(22.5)
對樣本中兩個變量分析,不但可作相關(guān)分析,還可進一步作直線回歸分析。仍以表22-1為示范,該例經(jīng)過直線相關(guān)分析,r=0.6097,兩變量間有直線關(guān)系,從相關(guān)系數(shù)計算時,已求得:
Σ(X-x)(Y-Y)=41.2000
Σ(X-x)2=677.4194
而Y=ΣY/n=99.2/31=3.2000
x=ΣY/n=534/31=17.2258
代入公式(22.4)
b=41.2000/677.4194=0.0608
代入公式(22.5)
a=3.2000-0.0608×17.2258=2.1527
代入公式(22.3)
=2.1527+0.0608X
(二)樣本回歸系數(shù)的假設(shè)檢驗
樣本回歸系數(shù)也有抽樣誤差問題,故需對b作假設(shè)檢驗,以評估b是否可能從回歸系數(shù)為零(即β=0)的總體中隨機抽得的。
檢驗步驟:
H0:β=0 即b是由β=0的總體中隨機抽樣的樣本回歸系數(shù)。
H1:β≠0
α=0.05
t檢驗:檢驗公式為
tb=|b|/sb公式(22.6)
式中sb是回歸系數(shù)的標(biāo)準(zhǔn)誤,計算公式為
公式(22.7)
式中sy.x為各觀察值Y距回歸直線(Y)的標(biāo)準(zhǔn)差,是當(dāng)X的影響被扣除后Y方面的變異指標(biāo)。可用以下公式計算:
公式(22.8)
公式(22.9)
本例上述已算得
Σ(X-x)2=677.4194
Σ(Y-Y)2=6.7400
Σ(X-x)(Y-Y)=41.2000
分別代入公式(22.9),(22.8),(22.7)和(22.6)得
Σ(Y-Y)2=6.7400-41.20002/677.4194=4.2343
tb=0.0608/0.01468=4.1417
分析評價 本例自由度v=31-2=29,查t值表,t0.01(29)=2.756,P<0.01,按α=0.05檢驗水準(zhǔn),拒絕無效假設(shè),可以認(rèn)為待產(chǎn)婦24小時尿中雌三醇含量與初生兒體重之間存在直線回歸關(guān)系。
(三)描繪回歸直線
根據(jù)以上求得回歸方程Y=2.1527+0.0608x,可以在自變量X的實測范圍內(nèi)(本例為7~27)任取X1和X2兩值代入上式求得在圖22-2中的P1(X1,Y1)和P2(X2,Y2)兩坐標(biāo)點,將兩點連結(jié)為一直線,就屬該方程的回歸直線。作圖要注意的是P1、P2兩點最好距離遠些,繪出的直線在坐標(biāo)上誤差就小些。
相關(guān)分析 | 應(yīng)用直線相關(guān)與回歸分析時的注意事項 |
關(guān)于“預(yù)防醫(yī)學(xué)/回歸分析”的留言: | 訂閱討論RSS |
目前暫無留言 | |
添加留言 |