梯度

最新推荐文章于 2024-08-10 22:15:42 发布

lucas_ch

最新推荐文章于 2024-08-10 22:15:42 发布

阅读量82

点赞数

分类专栏： nlp 文章标签：深度学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39693517/article/details/111415761

版权

nlp 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

梯度

概念

导数derivate
偏微分partial derivate，指定导数方向
梯度gradient ，偏导数的向量

梯度反映

函数变化趋势
增长方向和增长速度（箭头方向和长度）

如何搜索极值解

不平滑，有多个局部极大极小值
鞍点

影响因素

初始点
步长learning rate，应设置小一点，影响速度和精度
逃出局部极小值escape minima,惯性

常见函数的梯度

求导

激活函数Activation Functions

sigmoid/logistic

在这里插入图片描述

tanh

在这里插入图片描述

ReLU

优先使用

更加有效率的梯度下降以及反向传播：避免了梯度爆炸和梯度消失问题

在这里插入图片描述

softmax

在这里插入图片描述

在这里插入图片描述

Loss及其梯度

均方差MSE

torch.autograde.grade(loss,[w1,w2...]) #求导
loss.backward()  # 求导

grade.grade(loss,[w1,w2…]) #求导
loss.backward() # 求导

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
梯度

梯度概念导数derivate偏微分partial derivate，指定导数方向梯度gradient ，偏导数的向量梯度反映函数变化趋势增长方向和增长速度（箭头方向和长度）如何搜索极值解不平滑，有多个局部极大极小值鞍点影响因素初始点步长learning rate，应设置小一点，影响速度和精度逃出局部极小值escape minima,惯性常见函数的梯度求导激活函数Activation Functionssigmoid/logistictanhReLU
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

lucas_ch 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。