关于李航《统计学习方法》中的知识点整理——最小二乘法

  《统计学习方法》第11页在讨论过拟合与模型选择时给出了一个多项式函数拟合的例子,

  对于给定的数据集 T={(x1,y1)、(x2,y2)···(xN,yN)}. 其中xi是输入的观测值,yi是输出的观测值。假设给定的数据由M次多项式函数生成,选择最有可能产生这些数据的M次多项式函数。

  设M此多项式为:
     这里写图片描述
  其中x为单变量输入。
  首先确定模型的复杂度,即确定多项式的次数;然后再给定的复杂度下,该问题转化为求解一下经验风险最小化:
     这里写图片描述

  书中提及此题的经验风险最小化可以使用最小二乘法求的唯一解,下面,介绍最小二乘法(least square method)。

 最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。——摘自百度百科

  为了便于理解,结合上述实例采用最小二乘法的矩阵解法:

  我们考虑超定方程 :

     这里写图片描述

  我们首先确定多项式的次数为M,此时w0,w1···wM就可以写成一个参数向量 :
                   这里写图片描述
              

  将训练数据集中的每一个输入x转化为一个M+1维行向量,并将N个行向量组成一个N*(M+1)的矩阵:
                这里写图片描述
            

  将训练数据集中的所有的输出y写成一个列向量的形式:
                   这里写图片描述
              

  这时,就可以将经验风险矩阵化,写成如下形式:
           这里写图片描述
          

  为了使函数L取得最小值,我们对w进行求导 (这时候,为什么函数要乘一个1/2就显而易见了)得到:

        这里写图片描述      

  令导函数等于0,函数取得最值,因此当XTX为非奇异矩阵时,w有唯一解:
           这里写图片描述
  注:若XTX不可逆,则可以通过增加正则项,使其变为满秩矩阵再求解。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值