南瓜书第三章(1) 线性回归

c7c5ce8350254832b2dd9fa76b586326.png

一、基本形式

1、线性模型试图学得一个通过属性的线性组合来进行预测的函数:

404bc6502418426d9b572ff39b5e0a7c.png

注意:函数中x为列向量,x的系数为行向量,即w的转置为行向量,w和b学得之后,模型就得以确定

2、线性模型形式简单、易于建模,许多功能强大的非线性模型可以在线性模型的的基础上通过引入层级结构或高维映射而得到

     w直观表达了个属性在预测中的重要性,例如由下式可知:通过综合考虑几种因素来判断瓜的好坏,其中根蒂最要紧,而敲声比色泽更重要。

666aa2923b8648c5b660e6d884da4091.png

二、线性回归

给定数据集D={(x1,y1), (x2,y2),…,(xm,ym)了,其中xi =(xi1;xi2;.......;xid),yi属于R.“线性回归” (linear regression)试图学得一个线性模型以尽可能准确地预测实值输出标记。

1、一元线性回归

预测误差:y与y'之间的距离

均方误差:所有点的预测误差之和

线性回归:均方误差最小的直线

正定回归:点到直线的垂直距离最短

6e42c4d797a64a688b45be72b4c670d0.png

(1)最小二乘法:

93e413f1f3544f82888391fe21e4d613.png

 均方误差有非常好的几何意义,它对应了常用的欧几里得距离。基于均方误差最小化来进行模型求解的方法称为“最小二乘法”。在线性回归中,最小二乘法就是试图找到一条直线,使所有样本到直线上的欧式距离之和最小。

  • 最小二乘法法中平方的目的是为了保证误差是正数 
  • 对最小二乘法理解:对误差进行二乘(即平方)并求和(误差的平方和),得到损失函数,求出损失函数取最小值的函数中的参数

(2)最大似然估计: 

6c56b4c5bef846e69fb5afc821728e3c.png

      常用最大似然估计来估计概率分布的参数值。

    最大似然估计的直观想法:使得观测样本出现概率最大的分布就是待求分布,也即使得联合概率(似然函数)L( θ)取到最大值的 θ*即为 θ的估计值。

与最小二乘估计的等价:

fc74f1fa868b405a84049af8c32de389.jpeg

证明过程如下: 

0a67854a3128403a9c45faac451990c7.jpeg

(3)求解w与b

     损失函数即b4d2d1c8374842a9b23ea260ee9e3373.png

1)求解w和b的关键就在证明损失函数E(w,b)是一个凸函数

  知识补充:

①凸集与凸函数

61dacd450fbe4fee991d00ad522edf82.jpeg

凸函数(直观上就是f向下凸出)

②多元函数的一阶导数

8f1df5933c104ed4bde93b84736a4ec2.jpeg

③多元函数的二阶导数

8edb6a74e6de49db842b10ae7bfe70c7.png

定理:设D包含于R是非空开凸集,f是D上的n维标量函数,且f(x)在D上二阶连续可微,如果f(x)的Hessian (海塞)矩阵在D上是半正定的,则f(x)是D上的凸函数 

 则由定理可知:只需证明E(w,b)的海塞矩阵是半正定的,则E(w,b)是关于w和b的凸函数。

证明E(w,b)是关于w和b的凸函数过程

74779b10c6424d1bb6bb8ca7694beed1.jpeg

26643130245948ad9393b84a62db27b2.jpeg

2)再由凸函数的性质可求得w和b的数值

e758cb1617e9445b915a48e00873b68f.png

6821518b9896487c8668844e3f33b0d1.jpeg

2、多元线性回归

多元线性回归在一元线性回归的基础上加了部分特征,x变为向量

4e68d8fbef784bdab3186a6d578688cf.jpeg

370a7802333145f6ace78ad3212bf2c3.png

(1)导出损失函数

(2)求w

247bc87b4aaa457fbe263d8a8557bfbc.png

17db85ea6a964705b01123dfc9120dc9.png

    默认选用左侧分母布局

    令一阶导等于0,求出w

  • 7
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值