矩阵求导的例子


一个求导的例子

问题

(yXw)T(yXw)w∂(y−Xw)T(y−Xw)∂w

说明: ywy、w为列向量,XX为矩阵

式子演化

看到这个例子不要急着去查表求导,先看看它的形式,是u(w)v(w)u(w)∗v(w)的形式,这种形式一般求导较为复杂,因此为了简化运算,我们先把式子展开成下面的样子(注意:(Xw)T=wTXT(Xw)T=wTXT): 

(yTyyTXwwTXTy+wTXTXw)w∂(yTy−yTXw−wTXTy+wTXTXw)∂w

然后就可以写成四个部分求导的形式如下(累加后求导=求导后累加): 
yTywyTXwwwTXTyw+wTXTXww∂yTy∂w−∂yTXw∂w−∂wTXTy∂w+∂wTXTXw∂w

求导

  • yTyw∂yTy∂w求导 : yTyw=0∂yTy∂w=0

说明:分子部分为标量,分母部分为向量,找到维基百科中的Scalar-by-vector identities表格,在表格中匹配形式到第1行的位置,因为分母为列向量,因此为分母布局,对应的求导结果就是 00


  • yTXww∂yTXw∂w求导 : yTXww=XTy∂yTXw∂w=XTy

说明:同样的,在维基百科中的Scalar-by-vector identities表格,在表格中匹配形式到第11行的位置,对应的求导结果就是 XTyXTy 。


  • wTXTyw∂wTXTy∂w求导 : wTXTyw=(wTXTy)Tw=yTXww=XTy∂wTXTy∂w=∂(wTXTy)T∂w=∂yTXw∂w=XTy

说明:因为分子为标量,标量的转置等于本身,所以对分子进行转置操作,其等价于第二部分。


  • wTXTXww∂wTXTXw∂w求导 : wTXTXww=2XTXw∂wTXTXw∂w=2XTXw

说明:同样的,在维基百科中的Scalar-by-vector identities表格,在表格中匹配形式到第13行的位置,矩阵的转置乘上本身(XTXXTX)为对称矩阵当做表格中的AA ,所以得到求导结果 2XTXw2XTXw

整合

把四个部分求导结果进行相应的加减就可以得到最终的结果: 

因为之前博主的答案有错,所以我直接改为正确的答案了。

2X^T(Xw-y)


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值