简单线性回归

简单线性回归是利用统计方法寻找自变量x与因变量y之间的线性关系。通过最小二乘法求解直线方程参数,评估拟合优度使用决定系数R²,衡量误差使用均方误差MSE。皮尔逊相关系数r衡量线性相关性。注意,高R²并不一定意味着实际意义的因果关系,可能存在异常点影响。
摘要由CSDN通过智能技术生成

什么是简单线性回归

用统计的方法来得到连续自变量x和因变量y之间的线性关系。和一般线性回归的区别在于只有一个自变量。

华氏温度和摄氏温度之间的关系:

Fahr=95Cels+32

这是一个确定的线性关系,不是我们需要解决的问题。

相对的,我们要解决的问题是关于非确定的,如下所示,因变量y是一千万人中因皮肤癌致死的人数,自变量x是美国49个州的纬度。

皮肤癌和海拔

从上图中可以看到纬度越高,越往北,由于皮肤癌致死的越少。上图支持了该种假说。纬度和皮肤癌致死人数成反比,但是这种关系不怎么好,看着不像一个线性的。图中的散点表明了一种趋势,也有离散的。因此这不是确定的关系,而是统计上的关系。

还有一些其他的统计上的关系,例如:

  1. 身高和体重。身高增加体重也会增加,但不是一个确定的线性关系
  2. 喝了多少酒和血液里的酒精浓度

衡量拟合的好坏程度63280550

身高体重

对于上图总结的自变量身高和因变量体重之间的线性关系,哪条总结的比较好?

可以用如下方程来表示一条直线:

y^i=b0+b1xi

其中,图中的一点代表一个样本( xi , yi ),即一个学生的身高和体重, xi 表示第i个样本的特征值(自变量), yi 表示第i个样本的实际值(因变量), y^i 表示第i个样本的预测值。

一个点的误差:

ei=yiy^i

衡量一条直线总结其中关系的好坏,需要综合所有的样本点,所以使用均方误差来综合一条直线的误差。然后就可以使用最小二乘方法来找到能使该误差最小的参数 b0,b1 ,从而确定这条最好的直线。

Q=i=1n(yiy^i)2

最小二乘方法求解直线方程的参数

求解能使误差Q最小的参数 b0,b1 ,即求解如下的规划模型:

minQ=i=1n(yi(b0+b1xi))2

通过Q对 b0,b1 求导置为0,即求解极值

Qb0=0Q
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值