一元线性回归入门——自己写简单的回归算法

 


1.什么是线性回归?


  早在初中我们就学习过一次函数 ,它的一般形式我们应该还记得吧,就像是这样y=kx+b。这个一次函数实际上,就是一元一次函数。那时候学到的求解这个函数解析式的方法就是待定系数法 ,来确定其中kb的值。而线性回归这个词在统计学习中,同样是确定一个一次函数解析式中的位置参数,在图像上来看就相当于,你想找一条直线,让他们尽量穿过已知(一般都是大量的)的数据点,或者让他们到直线距离之和最短。但是这里用的不是待定系数法,下面介绍原因。

  现实世界中的数据总是存在各种误差,比如测量工具的误差,人度数的误差等等。而且数据的产生也大部分是一个随机的过程。所以如果现实世界中存在某些线性关系,那么这个关系也一定是近似的。所以其一次函数其实是这样的:

 y=kx+b+e
  其中e是数据偏离线性的误差,这个误差是服从正态分布的。什么!你还不知道什么是正态分布?那请先学习下相关知识。就是因为这个e的存在,所以对于每一组数据(x,y),他们的误差都是不同的,所以在前面那个式子中,我们不能使用待定系数法求得尽量精确的解。所以就需要一个更高端的做法。

  先不考虑怎么做的话,我们既然知道有这个误差存在了,那么我们就应该让这个误差尽量减小,数据已经是确定好了的,我们只能在计算方法上做文章。这里移项可以得到误差的方程: 
    |e|=|y-kx-n|
  所以现在我们就应该想方法,利用已知的(x,y)来找的合适的k,b使|e|的和对于所有的已知点最小,这就是线性回归的思路。下面介绍具体方法。

2.线性回归的方法

为了求解出最小的,我们可以其实可以利用平方消去其中的绝对值符号,得到了我们的要求的式子: 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值