2010年6月14日 星期一

Re: [問題] 迴歸裡的多元共線

作者: chungyuandye (chungyuandye) 看板: Statistics
標題: Re: [問題] 迴歸裡的多元共線
時間: Sat Jan 28 10:58:19 2006

※ 引述《latique (Afro)》之銘言:
: ※ 引述《sevenkiller (惡狠很的一發)》之銘言:
: : 就是自變項間是否有高度相關
: : 如果自變項間高度相關的話 會影響到對迴歸係數之假設檢測
: : 實際上操作的話 SPSS所提供之collinearity的統計包括
: : Tolerance VIF和Condition Index等
: : 這些統計是有關連性的 如Tolerance與VIF就是互為倒數 如果是Tolerance越小
: : 就表示該自變項與其他自變項間之共線性越高
: : 總而言之 共線性在分析當中是低比較好 共線性一高 就代表你的迴歸有問題
: : 解釋起來就很麻煩了
: 所以當各自變項出現共線性的關係
: 表示之間有高度相關
: 對於解釋依變項也較沒有解釋力的意思嗎∼∼

Y=b0+b1*X1+b2*X2+....+bk*Xk

Xi=c0+c1*X1+c2*X2+..+c_{i-1}*X_{i-1}+c_{i+1}*X_{i+1}+..ck*Xk
這邊可以算出一個R^2

VIF_i=1/(1-R^2)

VIF_i值很大(通常以10為門檻), 表示該自變數能被其他自變數所取代,
所以它可以不需要列在解釋變數

B=Inverse(X^T*X)*X^T*Y
如果是完全共線性, 那個X^T*X這個矩陣裡至少有兩行的元素等比例
所以行列式值為0, 那麼Inverse就不存在, 因此估計出來的B也會沒意義

應該是這樣子, 有錯請指正


--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 222.250.191.69

沒有留言:

張貼留言