关于向量、矩阵求导的记录

最新推荐文章于 2024-09-30 16:48:12 发布

j_in2018

最新推荐文章于 2024-09-30 16:48:12 发布

阅读量162

点赞数

文章标签：数据挖掘矩阵

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/j_in2018/article/details/109446970

版权

在修Data Mining这门课的时候，从多元函数的线性回归(Linear regression)、支持向量机(SVM)、神经网络(Neural Network)，都会涉及到很多求导数求极值的问题，看着Sunny老师上课轻松推导一头雾水，于是决定补一下这方面的求导的知识。
然后我看到网上的资料很多，于是这里应该不会自己从头整理一遍，更多是资料的整理和如果自己遇到的问题的推导记录吧。

入门详细过程

首先是要感谢刘建平Pinard的博客，基本从标量函数求导的定义讲起，一步一步到最后矩阵的求导。还有例子解析和练手，认为十分适合从头读起。（二）~（四）分别介绍了求导的3种方法。第五章的内容感觉有点复杂（有的步骤看不懂），而且在机器学习里似乎不常用，我也没细究了。

（一）求导定义与求导布局

这篇blog主要是介绍了分子布局和分母布局的定义。需要记住的有两个点：

一般有习惯，标量对矩阵或向量的求导采用分母布局，而向量对向量的求导采用分子布局
由于符号习惯（notation）的差异，可能存在不同资料中求导结果有所不同，一般会是转置的差别，如果有不一样首先要检查一下两份资料是否在同一的约定下，不要看到不一样就嚷嚷

（二）矩阵向量求导之定义法

这篇blog介绍了求导的第一种方法，从定义来。基本上就是把每个量展开，求导，再重新合并成矩阵形式。（不好做，但是是根本，也是通用方法）

（三）矩阵向量求导之微分法

这篇blog主要是利用的微分和导数的关系，即下面的式子。
在这里插入图片描述
这种方法避免了展开又重新合并的困难，但需要对矩阵微分运算以及迹函数的运算规律有较高的熟练度。文中的规律截图如下：

（四）矩阵向量求导链式法则

这篇blog介绍了平时标量常用的链式法则(chain rule)的向量拓展，如下：
在这里插入图片描述
值得注意的是：这里这个转置并不是链式法则造成的，而是仅仅因为notation的差异而造成的，如果把标量对向量的求导改成分子布局，则不会出现这样的转置，而会与常规标量的链式法则一样了。

（五）矩阵对矩阵的求导

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

j_in2018 CSDN认证博客专家 CSDN认证企业博客

码龄7年

25: 原创

18万+: 周排名

149万+: 总排名

9万+: 访问

: 等级

740: 积分

60: 粉丝

93: 获赞

40: 评论

516: 收藏

私信

关注

热门文章

分类专栏

最新评论

QT(5.12)+Qgis(3.10)开发环境搭建（QT Creator）
close2Y: 您好，我也是运行之后直接崩了，跟你报一样的错误，请问是怎么解决的？
QT(5.12)+Qgis(3.10)开发环境搭建（QT Creator）
Alcor123456: 请教一下博主，我现在集成成功了并能显示shp文件，但是我现在做的界面，在ui文件中qrc资源成功添加图片并可以显示，但是运行后加进来的图片就没有效果，是否跟qt.conf有关？，qrc_xxx.obj也成功生成，但就是添加不上，但是一旦把拷贝的那些dll及conf文件删掉后就可以正常显示，
QT(5.12)+Qgis(3.10)开发环境搭建（QT Creator）
这个人贼棒: 兄弟找不到proj.db这个问题咋解决的啊
QT(5.12)+Qgis(3.10)开发环境搭建（QT Creator）
weixin_49814991: 请问程序直接崩溃了是什么情况呢？
ESP32-Arduino PWM驱动
j_in2018: 嗷。在开头宏定义里写的，忘记放进来了~谢谢提醒

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。