R语言之自变量选择与逐步回归xt5.10

5.10 表5.6的数据是1968-1983年间美国与电话线制造有关的数据,各变量的含义如下:
x1——年份;
x2——国民生产总值(10亿美元);
x3——新房动工数(单位:1000);
x4——失业率(%);
x5——滞后6个月的最惠利率;
x6——用户用线增量(%);
y——年电话销量(百万尺双线)。
(1)建立y对x2~x6的线性回归方程。
(2)用后退法选择自变量。
(3)用逐步回归法选择自变量。
(4)根据以上计算结果分析后退法和逐步回归法的差异。

x1 x2 x3 x4 x5 x6 y
1968 1051.8 1503.6 3.6 5.8 5.9 5873
1969 1078.8 1486.7 3.5 6.7 4.5 7852
1970 1075.3 1434.8 5 8.4 4.2 8189
1971 1107.5 2035.6 6 6.2 4.2 7494
1972 1171.1 2360.8 5.6 5.4 4.9 8534
1973 1235.0 2043.9 4.9 5.9 5.0 8688
1974 1217.8 1331.9 5.6 9.4 4.1 7270
1975 1202.3 1160.0 8.5 9.4 3.4 5020
1976 1271.0 1535.0 7.7 7.2 4.2 6035
1977 1332.7 1961.8 7.0 6.6 4.5 7425
1978 1399.2 2009.3 6.0 7.6 3.9 9400
1979 1431.6 1721.9 6.0 10.6 4.4 9350
1980 1480.7 1290.8 7.2 14.9 3.9 6540
1981 1510.3 1100.0 7.6 16.6 3.1 7675
1982 1492.2 1039.0 9.2 17.5 0.6 7419
1983 1535.4 1200.0 8.8 16.0 1.5 7923

rm(list=ls())

# ---- 美国与电话线制造有关的数据 ----
# (1)建立y对x2~x6的线性回归方程 ----
data5.10 <- read.csv('D:/rwork/应用回归/习题数据/表5-6.csv',head=TRUE)
data5.10 <- data5.10[,c(-1)] #读取y和x2~x6的数据
lm5.10 <- lm(y~.,data=data5.10)
summary(lm5.10)
# 回归方程为y^=5922.827+4.864x2+2.374x3-817.901x4+14.539x5-846.867x6,
#  其中x2、 x5的系数未通过检验。



# (2)用后退法选择自变量 ----
lm5.10.back <- step(lm5.10,direction='backward')
summary(lm5.10.back)

# 后退法剔除P值最大的x5,保留x2,x3,x4,x6作为最终模型,模型的参数均通过显著性检验。
# 得回归方程为到y^=6007.3203+5.0681x2+2.3078x3-824.2614x4-862.6990x6,
# 模型表明年电话线销量y与国民生产总值x2、新房动工数x3、失业率x4、
#  用户用线增量x6有显著的线性关系。



# (3)用逐步回归法选择自变量 ----
lm5.10_step <- step(lm5.10,direction='both')
summary(lm5.10_step)
# 得到y^=6007.3203+5.0681x2+2.3078x3-824.2614x4-862.6990x6
# 使用step()函数进行逐步回归,其结果与后退法一致。



# (4)根据以上计算结果分析后退法与逐步回归法的差异 ----

(4)根据以上计算结果分析后退法和逐步回归法的差异。
R语言中step()函数是以AIC信息统计量为准则,通过选择最小的AIC信息统计量,来达到剔除或添加变量的目的。而在SPSS软件中,逐步回归则是通过偏F检验来确定选入或剔除的变量。故SPSS与R软件逐步回归的结果有所不同。但从两种回归方法本身的差异来说,后退法从全模型入手,每一步剔除一个变量,中途不会再选入变量,逐步回归法则是有进有出,可以保证最后得到的子集是最优回归子集。




参考课本:应用回归分析(R语言版),何晓群编著

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值