矩阵求导术（一）——标量对矩阵的求导方法

最新推荐文章于 2020-12-15 21:31:27 发布

qq_34134404

最新推荐文章于 2020-12-15 21:31:27 发布

阅读量1.2k

点赞数 1

分类专栏： tool 文章标签：矩阵求导

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34134404/article/details/103881894

版权

本文介绍了矩阵求导的基础知识，特别是在深度学习中的应用。矩阵求导是处理多变量计算的重要工具，对于理解机器学习算法的梯度计算至关重要。文章提到了微分和trace trick作为解决矩阵求导问题的主要思路，并指出向量（包括列向量和行向量）的求导考虑了分母布局。同时，文章涵盖了全微分的矩阵表示、微分运算法则以及特定情况下的简化技巧。

摘要由CSDN通过智能技术生成

矩阵求导术（一）——标量对矩阵的求导方法

前言

自从开始了解机器学习、深度学习的知识以来，便免不了要同矩阵打交道。

矩阵的基本运算法则、矩阵分解等均是很重要的基础知识，不论是在统计机器学习领域还是在如今大火的深度学习领域。矩阵运算使得多变量计算式可以更加简洁地表达，从而提高算法开发效率。但好在上述知识在一般的线性代数教材上均有详细阐述，但一旦涉及矩阵求导，就仿佛涉足了一个线性代数与数学分析的接壤区域，鲜有专门的教材体积如何计算矩阵求导。

最先是在一个微信公众号上读到了矩阵求导的文章，但文章最先直接就开始摆出一些所谓“常用结论”，这让我不太喜欢，我需要的是真正能说服我的通法，所以没有继续看下去；如今再次遇到矩阵求导问题，才记起那篇微信推送文章。好在文章后面有参考资料，所以系统解决了矩阵求导问题，这里做一个简略的总结。

参考资料

1. 微信推送原文；

2. 知乎高赞；

矩阵求导——标量对矩阵求导
主要参考上面知乎高赞文章
解决矩阵求导问题的总体思路是：微分+trace trick

注意，向量（含列向量、行向量）也是

最低0.47元/天解锁文章

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。