微分与梯度

最新推荐文章于 2023-07-08 09:50:20 发布

李峻枫

最新推荐文章于 2023-07-08 09:50:20 发布

阅读量559

点赞数

分类专栏：笔记文章标签：算法机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lijf2001/article/details/125675097

版权

笔记专栏收录该内容

52 篇文章 2 订阅

订阅专栏

前言

在最优化的过程中，常常需要用到导数，比如最经典的随机梯度下降法，其原理就是每次选取梯度最大的方向，对参数值进行修改。

求导

根据标量与向量，我们可以简单的分为 $4$ 类

标量对标量求导
标量对向量求导
向量对标量求导
向量对向量求导

标量对标量求导

这是最简单，最容易理解的。
在《微积分》、《高等数学》的课程中都有讲过，具体求法就不多赘述。

标量对向量求导

听上去名字可能有点奇怪，但是举个例子就很容易明白了。
$y=3\times x_1 + 4\times x_2^2 \newline \vec{x}=(x_1,x_2) \newline y=f(\vec{x}) \newline \frac{\partial y}{\partial \vec{x}}=\left( \frac{\partial y}{\partial x_1} ,\frac{\partial y}{\partial x_2} \right)=\left( 3 , 8\cdot x_2\right)$
可以看到，标量对向量的结果给是一个向量。

这个一定要理解，因为这是最优化中需要用到的。
- loss function是一个标量，而网络中的各种参数是一个变量
- loss function是网络中所有参数的函数

向量对标量求导

这个也比较好理解，就是向量的每一个值分别对标量求导。
最终求导的结果仍然是一个向量。

向量对向量求导

最终的结果是一个矩阵。
本质思想也是很简单，就是降维，最终的求导仍然是一个标量对标量求导。
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
微分与梯度

在最优化的过程中，常常需要用到导数，比如最经典的随机梯度下降法，其原理就是每次选取梯度最大的方向，对参数值进行修改。根据标量与向量，我们可以简单的分为4类。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。