矩阵简单导数运算


前言

以下内容均假设运算可以成立


向量与标量之间

向量与标量之间的导数均是向量,其第 i i i 个分量分别为
( ∂ a ⃗ ∂ x ) i = ∂ a i ⃗ ∂ x (\frac{\partial \vec{a}}{\partial x})_i = \frac{\partial \vec{a_i}}{\partial x} (xa )i=xai
( ∂ x ∂ a ⃗ ) i = ∂ x ∂ a i ⃗ (\frac{\partial x}{\partial \vec{a}})_i = \frac{\partial x}{\partial \vec{a_i}} (a x)i=ai x


矩阵与标量之间

矩阵与标量之间的导数均是矩阵,其第 i i i 行第 j j j 列元素分别为
( ∂ A ∂ x ) i j = ∂ A i j ∂ x (\frac{\partial \mathbf{A} }{\partial x})_{ij} = \frac{\partial A_{ij}}{\partial x} (xA)ij=xAij
( ∂ x ∂ A ) i j = ∂ x ∂ A i j (\frac{\partial x}{\partial \mathbf{A}})_{ij} = \frac{\partial x}{\partial A_{ij}} (Ax)ij=Aijx


函数关于向量

一阶导

一阶导数是向量,其第 i i i 个分量为
( ∇ f ( x ) ) i = ∂ f ( x ) ∂ x i (\nabla f(x))_i = \frac{\partial f(x)}{\partial x_i} (f(x))i=xif(x)

二阶导(海森矩阵)

二阶导数是矩阵,其第 i i i 行第 j j j 列元素为
( ∇ 2 f ( x ) ) i j = ∂ 2 f ( x ) ∂ x i ∂ x j (\nabla^2f(x))_{ij} = \frac{\partial^2 f(x)}{\partial x_i \partial x_j} (2f(x))ij=xixj2f(x)


规则

向量和矩阵的导数满足乘法法则

此 处 a 相 对 于 x 为 常 量 此处a相对于x为常量 ax

∂ x T a ∂ x = ∂ a T x x = a \frac{\partial x^Ta}{\partial x} = \frac{\partial a^Tx}{x} = a xxTa=xaTx=a
∂ A B ∂ x = ∂ A ∂ x B + A ∂ B ∂ x \frac{\partial AB}{\partial x} = \frac{\partial A}{\partial x}B + A\frac{\partial B}{\partial x} xAB=xAB+AxB

逆矩阵的导数表示

∂ A − 1 ∂ x = − A − 1 ∂ A ∂ x A − 1 \frac{\partial A^{-1}}{\partial x} = -A^{-1}\frac{\partial A}{\partial x}A^{-1} xA1=A1xAA1
此处
A − 1 A = I A^{-1}A = I A1A=I

求导的标量是矩阵元素

∂   t r ( A B ) ∂ A i j = B j i \frac{\partial\ tr(AB)}{\partial A_{ij}} = B_{ji} Aij tr(AB)=Bji
∂   t r ( A B ) ∂ A = B T \frac{\partial\ tr(AB)}{\partial A} = B^T A tr(AB)=BT
进而有
∂   t r ( A T B ) ∂ A = B \frac{\partial\ tr(A^TB)}{\partial A} = B A tr(ATB)=B
∂   t r ( A ) ∂ A = I \frac{\partial\ tr(A)}{\partial A} = I A tr(A)=I
∂   t r ( A B A T ) ∂ A = A ( B + B T ) \frac{\partial\ tr(ABA^T)}{\partial A} = A(B + B^T) A tr(ABAT)=A(B+BT)
∂ ∥ A ∥ F 2 ∂ A = ∂   t r ( A A T ) ∂ A = 2 A \frac{\partial \| A \|_F^2}{\partial A} = \frac{\partial\ tr(AA^T)}{\partial A} = 2A AAF2=A tr(AAT)=2A

链式法则

若函数 f f f g g g h h h 的符合,即 f ( x ) = g ( h ( x ) ) f(x) = g(h(x)) f(x)=g(h(x)) ,则有
∂ f ( x ) ∂ x = ∂ g ( h ( x ) ) ∂ h ( x ) ⋅ ∂ h ( x ) ∂ x \frac{\partial f(x)}{\partial x} = \frac{\partial g(h(x))}{\partial h(x)} \cdot \frac{\partial h(x)}{\partial x} xf(x)=h(x)g(h(x))xh(x)
举例
A x − b Ax - b Axb 看作一个整体可简化计算:
∂ ∂ x ( A x − b ) T W ( A x − b ) = ∂ ( A x − b ) ∂ x ⋅ 2 W ( A x − b ) = 2 A T W ( A x − b ) \frac{\partial}{\partial x}(Ax - b)^TW(Ax - b) = \frac{\partial (Ax - b)}{\partial x} \cdot2W(Ax - b) = 2A^TW(Ax - b) x(Axb)TW(Axb)=x(Axb)2W(Axb)=2ATW(Axb)


  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lgxo

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值