曲线拟合的几种解释

曲线拟合是一个经典的问题,将其数学化后是:已知训练数据 x 和对应的目标值 t 。通过构建参数为 w 的模型,当新的 x 出现,对应的t是多少。

本文将从误差和概率的角度探讨如何解决曲线拟合的问题,具体地,将阐述以下概念:

  • 误差函数
  • 正则化
  • 最大似然估计(MLE)
  • 最大后验估计(MAP)
  • 贝叶斯

误差角度

误差函数

直观的解决思路是最小化训练误差,公式如下:

minw12n=1N{y(xn,w)tn}2

正则化

上面的方法会遇到过拟合的问题,所以可以加上正则化的参数避免过拟合,改进后的公式如下:

minw12n=1N{y(xn,w)tn}2+λ2w2

概率角度

高斯分布假设

假设每个点都服从均值不一样方差一样的高斯分布,均值为 y(xn,w) ,方差为 β1 。那么,每个点的的概率分布是:

p(t|x,w,β)=N(y(xn,w),β1)

最大似然估计

为了求出上面的概率分布,首先要求出模型 w 的值,假设每个点之间相互独立,那么似然函数为:

p(t|x,w,β)=n=1NN(tn|y(xn,w),β1)

对上式取log,并最大化,得到:

maxwlnp(t|x,w,β)=β2n=1N{y(xn,w)tn}2+N2lnβN2ln(2π)

计算 w 只和上式右边的第一项有关,可以看到,最大似然的结果等同于误差函数的结果,也就是MLE等同于sum squared error function。

最大后验估计

根据MLE,我们可以得到模型 w 的参数,并且可以计算出 p(t|x,w,β) 似然函数进而求得对应点的值,可是这样同样存在过拟合的问题,为了解决这个问题,我们引入了先验估计,并结合似然函数计算出了后验估计。

假设 w 的先验估计如下:

p(w|α)=N(w|0,α1I)

根据后验估计等于似然函数乘以先验估计,也就是

p(w|x,t,α,β)$p(t|x,w,β)p(w|α)

同样适用最大似然估计的方法,不过这里不是作用在似然函数上,而是作用在后验分布上,我们得到:

minwβ2n=1N{y(xn,w)tn}2+α2w2

因此可以看到:

  • 最大化似然函数等同于最小化SSE。
  • 最大化后验分布等同于最小化SSE加上regulation。

贝叶斯

所谓贝叶斯,就是多次重复使用概率中的和规则和积规则。

为了方便,下文中认为 α,β 是固定的,在公式中省略了这两者,公式如下:

p(t|x,x,t)=p(t|x,w)p(w|x,t)dw

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值