动手学深度学习：矩阵计算

最新推荐文章于 2024-04-26 01:07:38 发布

GeniusAng丶

最新推荐文章于 2024-04-26 01:07:38 发布

阅读量873

点赞数 2

分类专栏：深度学习文章标签：深度学习矩阵张量

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45707277/article/details/118739423

版权

深度学习专栏收录该内容

22 篇文章 11 订阅

订阅专栏

标量导数

在这里插入图片描述

亚导数

在这里插入图片描述

这里的 $\partial$ 不是二阶偏导数里面的那个符号，而是亚导数，仅仅是符号相同而已

梯度

在这里插入图片描述

这里橙色矩形的长宽比例就代表了是标量还是向量还是矩阵
要注意列向量对标量的导数还是列向量，而标量对列向量的导数变成了行向量，也就是等价于转置操作
向量对向量的导数就张成了矩阵

这里可能不太好理解，结合下面的几张图理解一下

标量对列向量的导数

在这里插入图片描述

上面的样例可以自己动手写一写看看为什么，还是比较简单的

列向量对标量的导数

在这里插入图片描述

分子布局：分子为 y 或者分母为 x^T (即，分子为列向量或者分母为行向量)
分母布局：分子为 y^T 或者分母为 x (即，分子为行向量或者分母为列向量)
这里简单的理解也就是在标量和求导后的向量是同形状的前提下，标量在哪里就是什么布局，如上图y在分子的位置因此叫做分子布局

向量对向量的导数

在这里插入图片描述

可以看做 $\frac{\partial \bold y}{\partial x}$ 向右张成的矩阵，也就是对x_i的多次操作并合成的矩阵
或者可以看做 $\frac{\partial y}{\partial \bold x}$ 向下张成的矩阵
注意看上面两个公式中的加粗，加粗字体为向量

在这里插入图片描述

$\bm0$ 和 $\bm I$ 是全0矩阵和单位矩阵

扩展到矩阵对矩阵的导数

在这里插入图片描述

由图可以总结出：
向量（矩阵）做分子时：shape不变
向量（矩阵）做分母时：shape转置

以上所有的矩阵操作理解即可，在pytorch/mxnet/tensorflow中都有相应的API实现，并不用我们手算，但是最好了解一下输入张量的形状以及输出张量的形状

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
1
评论
动手学深度学习：矩阵计算

标量导数亚导数这里的∂\partial∂不是二阶偏导数里面的那个符号，而是亚导数，仅仅是符号相同而已梯度这里橙色矩形的长宽比例就代表了是标量还是向量还是矩阵要注意列向量对标量的导数还是列向量，而标量对列向量的导数变成了行向量，也就是等价于转置操作向量对向量的导数就张成了矩阵这里可能不太好理解，结合下面的几张图理解一下标量对列向量的导数上面的样例可以自己动手写一写看看为什么，还是比较简单的列向量对标量的导数分子布局：分子为 y 或者分母为 xT (即，分子为列向量或者
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

GeniusAng丶 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。