top of page

用SAS EM里的回歸模型控件,將回歸類型設置為‘線性回歸’,選取模型設置為‘逐步’,選取準則設置為交叉驗證誤差。用逐步回歸的模型來篩選變量。
在實際問題中,人們總是希望從對因變數 有影響的諸多變數中選擇一些變數作為引數,應用多元回歸分析的方法建立”最優”回歸方程以便對因變數進行預報或控制。所謂“最優”回歸方程,主要是指希望在回歸方程中包含所有對因變數 影響顯著的引數而不包含對 影響不顯著的引數的回歸方程。逐步回歸分析正是根據這種原則提出來的一種回歸分析方法。它的主要思路是在考慮的全部引數中按其對 的作用大小,顯著程度大小或者說貢獻大小,由大到小地逐個引入回歸方程,而對那些對 作用不顯著的變數可能始終不被引人回歸方程。另外,己被引人回歸方程的變數在引入新變數後也可能失去重要性,而需要從回歸方程中剔除出去。引人一個變數或者從回歸方程中剔除一個變數都稱為逐步回歸的一步,每一步都要進行 檢驗,以保證在引人新變數前回歸方程中只含有對 影響顯著的變數, 而不顯著的變數已被剔除。
逐步回歸分析的實施過程是每一步都要對已引入回歸方程的變數計算其偏回歸平方和(即貢獻),然後選一個偏回歸平方和最小的變數,在預先給定的 水準下進行顯著性檢驗,如果顯著則該變數不必從回歸方程中剔除,這時方程中其它的幾個變數也都不需要剔除(因為其它的幾個變數的偏回歸平方和都大於最小的一個更不需要剔除)。相反,如果不顯著, 則該變數要剔除,然後按偏回歸平方和由小到大地依次對方程中其它變數進行 檢驗。將對 影響不顯著的變數全部剔除,保留的都是顯著的。接著再對未引人回歸方程中的變數分別計算其偏回歸平方和,並選其中偏回歸平方和最大的一個變數, 同樣在給定 水準下作顯著性檢驗,如果顯著則將該變數引入回歸方程,這一過程一直繼續下去, 直到在回歸方程中的變數都不能剔除而又無新變數可以引入時為止,這時逐步回歸過程結束。
逐步回歸的參數設定
Stepwise Regression



bottom of page