数学推导1:矩阵求导

矩阵求导

无论是从事图像相关的研究工作,还是其他科学工作,矩阵知识是必不可少的。在查看论文时,总会遇到大量的矩阵推导、最优值以及迭代更新等等相关问题。网上的很多博客中,内容基本相同,但部分里面甚至还有一些错误,我深受其害。。。去谷歌了一下,找到了国外的资料,来给大家分享。本文主要简单的介绍矩阵求导问题,如果自己能跟着示例,自己每个都能推导出来,那么矩阵求导对你来说应该不是什么难事了。

##主要内容:
MarkDown编辑公式还是不太方便,借助一下在线LaTeX公式编辑器来完成本篇文档内容。
在线LaTex

######(矩阵迹、Jacobian、Hessian求导方法暂不更新,码公式太累,有需要的大家留言,我在决定更新与否)
###1.线性积求导 Derivatives of Linear Products

  • 示例一

  • d / d x ( A Y B ) = A ∗ d / d x ( Y ) ∗ B {d}/{d}\mathbf{x}\textbf{}(\mathbf{AYB}) = \mathbf{A}*{d}/{dx}(\mathbf{Y})*\mathbf{B} d/dx(AYB)=Ad/dx(Y)B

  • d / d x ( A y ) = A ∗ d / d x ( y ) {d}/{d}\mathbf{x}\textbf{}(\mathbf{Ay}) = \mathbf{A}*{d}/{dx}(\mathbf{y}) d/dx(Ay)=Ad/dx(y)

  • 示例二(常碰到

  • d / d x ( x T A ) = A {d}/{d}\mathbf{x}\textbf{}(\mathbf{x^{T}A}) = \mathbf{A} d/dx(xTA)=A

  • d / d x ( x T ) = I {d}/{d}\mathbf{x}\textbf{}(\mathbf{x^{T}}) = \mathbf{I} d/dx(xT)=I

  • d / d x ( x T a ) = d / d x ( a T x ) = a {d}/{d}\mathbf{x}\textbf{}(\mathbf{x^{T}a}) ={d}/{d}\mathbf{x}\textbf{}(\mathbf{a^{T}x})= \mathbf{a} d/dx(xTa)=d/dx(aTx)=a

  • 示例三(常碰到

  • d / d X ( a T X b ) = a b T {d}/{d}\mathbf{X}\textbf{}(\mathbf{a^{T}Xb}) = \mathbf{ab^{T}} d/dX(aTXb)=abT

  • d / d X ( a T X a ) = a a T {d}/{d}\mathbf{X}\textbf{}(\mathbf{a^{T}Xa}) = \mathbf{aa^{T}} d/dX(aTXa)=aaT

  • 示例四(常碰到

  • d / d X ( a T X T b ) = b a T {d}/{d}\mathbf{X}\textbf{}(\mathbf{a^{T}X^{T}b}) = \mathbf{ba^{T}} d/dX(aTXTb)=baT

  • 示例五

  • d / d x ( Y Z ) = Y ∗ d / d x ( Z ) + d / d x ( Y ) ∗ Z {d}/{d}\mathbf{x}\textbf{}(\mathbf{YZ}) = \mathbf{Y}*{d}/{d}\mathbf{x}(\mathbf{Z})+d/{d}\mathbf{x}(\mathbf{Y})\mathbf*{\mathbf{Z}} d/dx(YZ)=Yd/dx(Z)+d/dx(Y)Z

###2.二次型求导 Derivatives of Quadratic Products

  • 示例一

  • d / d x ( A x + b ) T C ( D x + e ) = A T C ( D x + e ) + D T C T ( A x + b ) {d}/d\mathbf{x}(\mathbf{Ax+b})^{T}\mathbf{C}(\mathbf{Dx+e})=\mathbf{A}^{T}\mathbf{C}(\mathbf{Dx+e})+\mathbf{D}^{T}\mathbf{C}^{T}(\mathbf{Ax+b}) d/dx(Ax+b)TC(Dx+e)=ATC(Dx+e)+DTCT(Ax+b)

  • d / d x ( x T C x ) = ( C + C T ) x {d}/d\mathbf{x}(\mathbf{x}^{T}\mathbf{C}\mathbf{x})=(\mathbf{C}+\mathbf{C}^{T})\mathbf{x} d/dx(xTCx)=(C+CT)x常碰到

  • d / d x ( x T C x ) = 2 C x {d}/d\mathbf{x}(\mathbf{x}^{T}\mathbf{C}\mathbf{x})=2\mathbf{C}\mathbf{x} d/dx(xTCx)=2Cx [注:C是对称的] (常碰到

  • d / d x ( x T x ) = 2 x {d}/d\mathbf{x}(\mathbf{x}^{T}\mathbf{x})=2\mathbf{x} d/dx(xTx)=2x常碰到

  • d / d x ( A x + b ) T ( D x + e ) = A T ( D x + e ) + D T ( A x + b ) {d}/d\mathbf{x}(\mathbf{Ax+b})^{T}(\mathbf{Dx+e})=\mathbf{A}^{T}(\mathbf{Dx+e})+\mathbf{D}^{T}(\mathbf{Ax+b}) d/dx(Ax+b)T(Dx+e)=AT(Dx+e)+DT(Ax+b)

  • d / d x ( A x + b ) T ( A x + b ) = 2 A T ( A x + b ) {d}/d\mathbf{x}(\mathbf{Ax+b})^{T}(\mathbf{Ax+b})=2\mathbf{A}^{T}(\mathbf{Ax+b}) d/dx(Ax+b)T(Ax+b)=2AT(Ax+b)

  • d / d x ( A x + b ) T C ( A x + b ) = 2 A T C ( A x + b ) {d}/d\mathbf{x}(\mathbf{Ax+b})^{T}\mathbf{C}(\mathbf{Ax+b})=2\mathbf{A}^{T}\mathbf{C}(\mathbf{Ax+b}) d/dx(Ax+b)TC(Ax+b)=2ATC(Ax+b) [注:C是对称的]

  • 示例二

  • d / d X ( a T X T X b ) = X ( a b T + b a T ) {d}/d\mathbf{X}(\mathbf{a}^{T}\mathbf{X}^{T}\mathbf{Xb})=\mathbf{X}(\mathbf{ab^{T}}+\mathbf{ba^{T}}) d/dX(aTXTXb)=X(abT+baT)

  • d / d X ( a T X T X a ) = 2 X a a T {d}/d\mathbf{X}(\mathbf{a}^{T}\mathbf{X}^{T}\mathbf{Xa})=2\mathbf{X}\mathbf{aa^{T}} d/dX(aTXTXa)=2XaaT

  • 示例三

  • d / d X ( a T X T C X b ) = C T X a b T + C X b a T {d}/d\mathbf{X}(\mathbf{a}^{T}\mathbf{X}^{T}\mathbf{CXb})=\mathbf{C}^{T}\mathbf{X}\mathbf{ab^{T}}+\mathbf{CX}\mathbf{ba^{T}} d/dX(aTXTCXb)=CTXabT+CXbaT

  • d / d X ( a T X T C X a ) = ( C + C T ) X a a T {d}/d\mathbf{X}(\mathbf{a}^{T}\mathbf{X}^{T}\mathbf{CXa})=(\mathbf{C}+\mathbf{C}^{T})\mathbf{X}\mathbf{aa^{T}} d/dX(aTXTCXa)=(C+CT)XaaT

  • d / d X ( a T X T C X a ) = 2 C X a a T {d}/d\mathbf{X}(\mathbf{a}^{T}\mathbf{X}^{T}\mathbf{CXa})=2\mathbf{C}\mathbf{X}\mathbf{aa^{T}} d/dX(aTXTCXa)=2CXaaT [注:C是对称的]

  • 示例四

  • d / d X ( ( X a + b ) T C ( X a + b ) ) = ( C + C T ) ( X a + b ) a T {d}/d\mathbf{X}((\mathbf{Xa+b})^{T}\mathbf{C}(\mathbf{Xa+b}))=(\mathbf{C}+\mathbf{C}^{T})(\mathbf{Xa+b})\mathbf{a^{T}} d/dX((Xa+b)TC(Xa+b))=(C+CT)(Xa+b)aT

###3.立方积求导 Derivatives of Cubic Products

  • 示例一

  • d / d x ( x T A x x T ) = ( A + A T ) x x T + x T A x I {d}/d\mathbf{x}(\mathbf{x}^{T}\mathbf{Ax}\mathbf{x}^{T})=(\mathbf{A}+\mathbf{A}^{T})\mathbf{x}\mathbf{x}^{T}+\mathbf{x}^{T}\mathbf{AxI} d/dx(xTAxxT)=(A+AT)xxT+xTAxI

###4.逆求导 Derivatives of Inverses

  • 示例一

  • d / d x ( Y − 1 ) = − Y − 1 d / d x ( Y ) Y − 1 {d}/d\mathbf{x}(\mathbf{Y}^{-1})=-\mathbf{Y}^{-1}d/d\mathbf{x}(\mathbf{Y})\mathbf{Y}^{-1} d/dx(Y1)=Y1d/dx(Y)Y1

  • 9
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

微风❤水墨

你的鼓励是我最大的动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值