机器学习基石HOW部分(1)

机器学习基石HOW部分(1)


标签:机器学习基石

第九章

analytic solution wLIN=Xy with linear regression hypotheses and squared error

从方程的形式、误差的衡量方式、如何最小化 Ein 的角度出发,并简单分析了Hat Matrix的性质与几何意义,希望对线性回归这一简单的模型有个更加深刻的理解。

方程的形式

linear regression hypothesis: h(x)=wTx ,长得很像 perceptron,只不过是少了sign。
线性回归:寻找直线。平面或者超平面,使得输入数据的残差最小(残差是指观测值与预测值(拟合值)之间的差,即是实际观察值与回归估计值的差。在回归分析中,测定值与按回归方程预测的值之差,以δ表示。残差δ遵从正态分布N(0,σ2)。

误差的衡量

平方误差(squared error):

Ein(hw)=1Nn=1N(h(xn)yn)2

Eout(hw)=1NE(x,y) P(h(xn)yn)2

如何最小化 Ein

先看看 Ein 的矩阵能够怎样表示:

Ein(hw)=1Nn=1N(wTxnyn)2
=1Nn=1N(xTnwyn)2=1N||Xwy||2

现在很明显,要得到最小的 Ein 就是把上面的矩阵最小化。
minwEin(w)=1N||Xwy||2
X与y来源于D,是固定不变的,因此它是一个以w为变量的函数。

画画 Ein 的图,它是连续,处处可微的凸函数。
图如下:
$E_{in}$

很明显,当 Ein 的曲线到达谷底的时候, Ein 有最小值。结合微积分的只是,当曲线的导数为0的时候, Ein 最小。
于是,要得到最小的 Ein 就变成了找到 WLIN 使得 Ein(wLIN)=0 .

把微分从一元的简单形式开始计算,然后推广到多元。经过计算得到 Ein(w)=2N(XTXwXTy)
现在就是要找到 WLIN 使得 Ein(w)=2N(XTXwXTy)=0

XTX 可逆的时候,答案还是很容易算出来的。就是让 XTXw=XTy ,然后就可以得到 Ein(wLIN)=(XTX1XTy)
因为 N>>d+1 ,所以 XTX 一般都是可逆的,此时解是唯一的。
如果 XTX 不可逆,那就会有许多解了。

XTX 可逆,可以用一个神奇的 X 来代替 XTX1XT ,由此,

Ein(wLIN)=Xy

用以 wLIN 为参数的线性方程对原始数据做预测,可以得到拟合值 y=XwLIN=XXy 。这里又称H=XX†为Hat Matrix,帽子矩阵,H为y带上了帽子,成为 y^ ,取名字取得很形象。

###Hat Matrix
帽子矩阵的几何意义

  • y^=XwLIN是X的一个线性组合,X中每个column对应RN下的一个向量,共有d+1个这样的向量,因此y^在这d+1个向量所构成的span(平面)上。
  • 事实上我们要做的就是在这个平面上找到一个向量y^使得他与真实值之间的距离|y−y^|最短。不难发现当y^是y在这个平面上的投影时,即y−y^⊥span时,|y−y^|最短。
  • 所以之前说过的Hat Matrix H,为y戴上帽子,所做的就是投影这个动作,寻找span上y的投影。
  • Hy=y^,(I−H)y=y−y^。(I为单位矩阵)
    trace(IH)=N(d+1)

    一个矩阵的trace等于该矩阵的所有特征值(Eigenvalues)之和。

有噪音的y

假设y由f(X)∈span+noise构成的。有y=f(X)+noise。之前讲到H作用于某个向量,会得到该向量在span上的投影,而I−H作用于某个向量,会得到那条与span垂直的向量,在这里就是图中的y− y^(IH)noise=y \hat{y}$。

这个y− y^ Ein(wLIN)=1N||yy^||2=1N||(IH)noise||2 =1Ntrace(IH)||noise||2 =1N(N(d+1))||noise||2

因此 Ein¯¯¯¯¯==noiselevel(1d+1N) Eout¯¯¯¯¯¯==noiselevel(1+d+1N)

learing curve

N -> , Ein¯¯¯¯¯ Eout¯¯¯¯¯¯ 都都向 σ2 (noise level)收敛,并且他们之间的差异被 2(d+1)N 给bound住了。有那么点像VC bound,不过要比VC bound来的更严格一些。

所以,兜兜转转,说明了用线性回归,学习是可行的。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值