R应用-多元线性回归

#准备好数据,看看pv与uv、cindex、hsindex之间的关系
f<-c[,c(-3,-5)]
head(f)
    pv   uv cindex hsindex
1 5531 3279   1458     2296
2 6439 4070   1425     2280
3 5404 3253   1477     2291
4 6121 4137   1458     2286
5 6654 4532   1473     2268
6 6226 4266   1446     2212

#检测二变量关系
cor(f)
              pv         uv     cindex hsindex
pv       1.0000 0.6094186 -0.2195932   0.6523
uv       0.6094 1.0000000   0.0002991   0.3587
cindex   -0.2196 0.0002991   1.0000000 -0.6506
hsindex   0.6523 0.3586755 -0.6505730   1.0000

#绘制因变量与自变量的散点图矩阵
library(car)
scatterplotMatrix(f,spread=F,lty.smooth=2,main="scatter plot matrix")

#大多数预测变量都一定程度上出现了偏斜,pv随着uv的上升而上升,pv随着cindex的下降而下降,pv随着hsindex的上升而上升。

#拟合多元线性回归模型
lmpv1<-lm(pv~uv+cindex+hsindex,data=f)
summary(lmpv1)
Call:
lm(formula = pv ~ uv + cindex + hsindex, data = f)

Residuals:
    Min       1Q   Median       3Q     Max 
-2315.3   -463.6     43.5   466.1   2863.6 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -2.04e+04   5.44e+03   -3.76   0.00042 ***
uv           4.80e-01   1.22e-01     3.93   0.00024 ***
cindex       2.71e+00   1.58e+00     1.72   0.09090 .  
hsindex       8.90e+00   1.73e+00     5.15   3.7e-06 ***
---
Signif. codes:   0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 809 on 55 degrees of freedom
Multiple R-squared:   0.608, Adjusted R-squared:   0.587 
F-statistic: 28.5 on 3 and 55 DF,   p-value: 3.01e-11
#所有的预测变量解释了pv 60.8%的方差

#选择最佳的回归模型
全子集回归,即所有可能的模型都被评价了。

#基于调整R平方,不同子集大小的三个最佳模型
library(leaps)
leaps<-regsubsets(pv~uv+cindex+hsindex,data=f,nbest=3)
plot(leaps,scale="adjr2")


含uv、cindex、hsindex的模型调整R平方值为0.59最高,三预测变量模型是最佳模型。

#基于Mallows Cp统计量,不同子集大小的三个最佳模型
library(car)
subsets(leaps,statistic="cp",main="cp plot for all subsets regression")
abline(1,1,lty=2,col="red")#画截距项和斜率均为1的直线



#越好的模型离截距项和斜率均为1的直线越近——即u-c-h三预测变量模型lm(pv~uv+cindex+hsindex,data=f)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值