【示例】
Y与有相关关系,考虑回归模型,用逐步回归法求“最优”回归方程,观测数据如下:
使用SAS中的REG过程来完成逐步回归计算,假设引入变量的显著性水平为0.10,剔除变量的显著性水平为0.10
SAS代码
data d1;
input x1-x4 y ;
cards;
7 26 6 60 78.5
1 29 15 52 74.3
11 56 8 20 104.3
11 31 8 47 87.6
7 52 6 33 95.9
11 55 9 22 109.2
3 71 17 6 102.7
1 31 22 44 72.5
2 54 18 22 93.1
21 47 4 26 115.9
1 40 23 34 83.8
11 66 9 12 113.3
10 68 8 12 109.4
;
proc reg data=d1;
model y=x1-x4
/selection=stepwise
sle=0.10 sls=0.10;
run;
quit;
逐步选择过程
计算各情况R方值
引入一个最优变量
继续引入最优变量
继续引入最优变量
可以发现引入新变量后原变量x4变得不再重要,故第四步剔除x4
得到最优回归模型:
Y与x1,x2的二元回归模型的决定系数