数据分析与挖掘 - R语言:多元线性回归

一个简单的例子!
环境:CentOS6.5
Hadoop集群、Hive、R、RHive,具体安装及调试方法见博客内文档。

 

线性回归主要用来做预测模型。

1、准备数据集:

X       Y
0.10    42.0 
0.11    43.5 
0.12    45.0 
0.13    45.5 
0.14    45.0 
0.15    47.5 
0.16    49.0
0.17    53.0
0.18    50.0
0.20    55.0
0.21    55.0
0.23    60.0
> s=read.table("test-1.txt", header = F)

 

2、确定线性回归函数:Y = β0 + β1X + ε

其中β0 + β1X 表示Y随X的变化而线性变化的部分;ε是随机误差,是一切不确定因素的总和,其值不可测。

 

3、使用R语言中的lm()函数求解

> x=s$V1
> y=s$V2
> lm.sol<-lm(y ~ 1+x)
> summary(lm.sol)

指标1:Pr(>|t|) 表示P– 值,即概率值。***说明极为显著, **说明高度显著, *说明显著, .说明不太显著,没有记号为不显著。

指标2:R-Squared: 0.9481 的值越大越好,至少应该在0.8以上。

 

4、绘制图形

> plot(x,y)
> abline(lm.sol)

5、作出预测

> z=data.frame(x=0.24)
> predict(lm.sol, z)

预测结果为:

       1 
59.89318 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值