机器学习(补充知识)之最小二乘法

个人学习笔记(欢迎交流指正): 

                                            最小二乘法

1.1 最小二乘法简介

百度百科:最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。

下面以最简单的一元线性回归模型来解释最小二乘法的原理。

1.2 一元线性回归模型

(1)一元线性回归模型一般形式:

                                                                             f(x) = w*x + b

残差形式为:

                                                                             y_{i} = f(x_{i}) = w*x_{i} + b + e_{i}

                                                                            e_{i} = y_{i} - (w*x_{i} + b)

其中,e_{i} 为样本(x_{i}, y_{i})的误差。

(2)平方损失函数:

  在训练集 T = \left \{ \right.(x_{1}, y_{1}), (x_{2}, y_{2}), ..., (x_{N}, y_{N})\left. \right \}上, 模型平方损失函数为:

                                                             L(f) = \sum_{i=1}^{N}e_{i}^{2} = \sum_{i = 1}^{N} (\hat{y}_{i} - y_{i})^{2} = \sum_{i = 1}^{N} (w * x_{i} + b - y_{i})^{2}

1.3 最小二乘法求解

为了使求出的回归模型能够尽可能好的拟合训练样本,这条直线处于样本数据的中心位置最合理。选择最佳拟合曲线的标准可以确定为:使总的拟合误差(即总残差)达到最小。有以下三个标准可以选择:

        (1)用“残差和最小”确定直线位置是一个途径。但很快发现计算“残差和”存在相互抵消的问题(有正有负)。
        (2)用“残差绝对值和最小”确定直线位置也是一个途径。但绝对值的计算比较麻烦(还是要判断正负)。
        (3)最小二乘法的原则是以“残差平方和最小”确定直线位置。用最小二乘法除了计算比较方便外,得到的估计量还具有优良特性,这种方法对异常值非常敏感。(利用平方误差函数作为最优函数求解其实源自极大似然估计,有兴趣可以自己查一下相关数学背景)

以普通最小二乘法为例,使L(f)最小来确定直线,L(f)可以看做是 w 和 b 的函数,问题转化为极值问题:

L(f)w 和 b 的偏导数:

                                                              \frac{\partial L}{\partial w} =2\sum_{i=1}^{N}[(wx_{i}+ b - y_{i}) * x_{i}] = 0

                                                              \frac{\partial L}{\partial b} =2\sum_{i=1}^{N}[(wx_{i}+ b - y_{i})] = 0

 

求得:

                                                             w = \frac{N\sum_{i = 1}^{N}x_{i}y_{i} - \sum_{i=1}^{N}x_{i}\sum_{i=1}^{N}y_{i}}{N\sum_{i=1}^{N}x_{i}^{2} - (\sum_{i=1}^{N}x_{i})^{2}}

                                                             b = \frac{\sum_{i = 1}^{N}x_{i}^{2}\sum_{i=1}^{N}y_{i} - \sum_{i=1}^{N}x_{i}\sum_{i=1}^{N}x_{i}y_{i}}{N\sum_{i=1}^{N}x_{i}^{2} - (\sum_{i=1}^{N}x_{i})^{2}}

1.4 最小二乘法矩阵形式推广

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值