矩阵求导的通用法则,标量、向量和矩阵的所有情况相互求导

标量通俗的说就是一个数,向量可以看成行或列为1的矩阵。3者两两结合有9中方式。

1 标量与标量

标量与标量就是正常的以为函数求导。

2 标量与向量

2.1 向量对标量求导

向量的每个分量对标量求导:

 

2.2 标量对向量求导

结果为一个与向量同阶的向量,每个元素为标量对对应位置向量元素的倒数:

 

因为是对向量求导,这里采用分子布局(即分母不变,分子转置。分子和分母布局求出来的结果互为转置):

  

3 标量与矩阵

标量的结合比较特殊,也很简单 。

3.1 矩阵对标量求导

对矩阵中的每个元素分别对标量求导即可。

3.2 标量对矩阵求导

标量对矩阵的求导,我起初觉得不适合求导规律,但查阅之后发现,针对此类情况,数学界有专门的定义。即求导结果为一个与矩阵同阶的矩阵,其中元素为标量对对应位置元素的倒数,如下图:

 

4 矩阵和向量之间求导的通用法则

4.1 问题描述

我们知道,向量可以看成行或列为1的特殊矩阵,矩阵也可以分解成行或列向量组成的列或行向量。

对于m*n阶矩阵Y:

对于p*q阶矩阵X:

将Y分解为m个1*n的行向量组成的列向量:

 将X分解为q个p*1的列向量组成的行向量:

 4.2 第一步转化

所以问题就转化为第一步先求列向量对行向量求导:

根据求导法则,结果如下:

 这是一个m*q的大矩阵,每一个元素是1*n的行向量p*1的列向量求导的结果,为p*n阶矩阵:

4.3 第二步转化

所以问题的第二步就变为行向量对列向量求导。

对于每一个小块矩阵,根据上述分解结果有:

 

 根据求导法则:

 

4.4 下来就是标量对标量的求导

最后结果矩阵为m*p行n*q列。至此结束。

 

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

和道一文字_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值