机器学习中的矩阵向量求导(三) 矩阵向量求导之微分法

本文介绍了在机器学习中使用微分法求解矩阵向量求导的问题,包括矩阵微分的定义、性质,并通过实例详细解释了如何利用微分法求解导数,最后总结了微分法在矩阵求导中的应用和优势。
摘要由CSDN通过智能技术生成

 在机器学习中的矩阵向量求导(二) 矩阵向量求导之定义法中,我们讨论了定义法求解矩阵向量求导的方法,但是这个方法对于比较复杂的求导式子,中间运算会很复杂,同时排列求导出的结果也很麻烦。因此我们需要其他的一些求导方法。本文我们讨论使用微分法来求解标量对向量的求导,以及标量对矩阵的求导。

    本文的标量对向量的求导,以及标量对矩阵的求导使用分母布局。如果遇到其他资料求导结果不同,请先确认布局是否一样。

1. 矩阵微分

    在高数里面我们学习过标量的导数和微分,他们之间有这样的关系:df=f′(x)dxdf=f′(x)dx。如果是多变量的情况,则微分可以写成:

df=∑i=1n∂f∂xidxi=(∂f∂x)Tdxdf=∑i=1n∂f∂xidxi=(∂f∂x)Tdx

    从上次我们可以发现标量对向量的求导和它的向量微分有一个转置的关系。

    现在我们再推广到矩阵。对于矩阵微分,我们的定义为:

df=∑i=1m∑j=1n∂f∂XijdXij=tr((∂f∂X)TdX)df=∑i=1m∑j=1n∂f∂XijdXij=tr((∂f∂X)TdX)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

文宇肃然

精神和物质鼓励你选一个吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值