机器学习(四)——最小二乘(Least squares)

原文:http://cs229.stanford.edu/notes/cs229-notes1.pdf

借助矩阵导数的工具,现在让我们继续以封闭的形式找到\theta的值,使得J(\theta )最小化。我们从用矩阵向量表示法重写J开始。

给定一个训练集,设计矩阵Xm\times n矩阵,(实际上是m\times (n+1),如果我们包括拦截项),其中每一行为训练样本的输入值:

另外,让是包含训练集中所有目标值的m维向量:

现在,由于,我们可以很容易的证明:

因此,利用一个向量z的的性质,即,我们有

下面给出一些矩阵之间的关系,不做证明:

最后,为了最小化J,让我们找出它与\theta有关的导数。结合方程(2)和(3),我们发现

因此:

 

在上面推导过程的第三步中,我们用到了一个定理,即一个实数的迹是它本身;第四步用到了trA=trA^{T}这个定理,最后一项不含\theta求导时可舍去;第五步使用了等式 (5) ,令 A^{T}=0,B=B^{T}=X^{T}X,和C=I,以及等式 (1) 。为了最小化J,我们令导数为0,就得到了它的 正规方程(normal equations) :

 

因此,最小化J(\theta )\theta的闭式解(解析解)如下:

 

 

如何使用等式(5),下面给出了说明:

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值