Pytorch 深度学习框架快速学习（1）---- 神经网络惯性因子 Neural Network Momentum

最新推荐文章于 2024-04-25 15:05:51 发布

上海拓朗思科技

最新推荐文章于 2024-04-25 15:05:51 发布

阅读量734

点赞数

分类专栏： AI NN Pytorch 文章标签：神经网络深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuelangqingkong/article/details/114658906

版权

AI 同时被 3 个专栏收录

5 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

谷明科技，用AI赋能未来

神经网络是当前机器学习中炙手可热的一个模型门类，其中的调参技巧也是层出不穷，从刚开始的BP，到SGD等。

在使用 Pytorch 的过程中，我们会发现在配置 SGD optimizer 的时候需要配置一个参数 momentum，那么这个参数是做什么的呢？

optimizer = optim.SGD(model.fc.parameters(), lr=1e-2, momentum=0.9)

这个必须要从SGD 的原理开始说起：

图的最上方为每个iteration（每个batch为一个iteration）中，权重的变化量的表达式，即学习因子 * 误差对当前参数的偏微分。

但是SGD 的一大诟病点就是其对于异常点的波动太大，即如果出现了一个噪音点或者错误的数据，那么其对参数的调整可能十分剧烈，造成了参数的波动变化，不利于模型的稳定学习。

所以在上图的下方，增加了一个对上一个 iteration 的权重偏差的引入，可以理解为汽车在驾驶过程中无论是打方向盘还是减速时候的惯性。

这样的话，当模型遇到一个比较大的误差的时候，不会完全按照当前误差进行调整参数，还要考虑之前的误差因素！

上海拓朗思科技

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Pytorch 深度学习框架快速学习（1）---- 神经网络惯性因子 Neural Network Momentum

神经网络是当前机器学习中炙手可热的一个模型门类，其中的调参技巧也是层出不穷，从刚开始的BP，到SGD等。在使用 Pytorch 的过程中，我们会发现在配置 SGD optimizer的时候需要配置一个参数 momentum，那么这个参数是做什么的呢？optimizer = optim.SGD(model.fc.parameters(), lr=1e-2, momentum=0.9)这个必须要从SGD 的原理开始说起：图的最上方为每个iteration（每个batch为一个iterat.
复制链接

扫一扫

专栏目录

上海拓朗思科技 CSDN认证博客专家 CSDN认证企业博客

码龄15年

53: 原创

11万+: 周排名

6万+: 总排名

10万+: 访问

: 等级

1348: 积分

50: 粉丝

57: 获赞

21: 评论

125: 收藏

私信

关注

热门文章

分类专栏

深度学习 2篇
Postgresql 4篇
网站开发 25篇
TensorFlow 1篇
Pytorch 2篇
elasticsearch 2篇
django 8篇
NN 1篇
SSL 1篇
Php 1篇
Mysql/MariaDB 1篇
Encryption 3篇
C/C++ 1篇
CommonSense 1篇
Data Mining 3篇
iOS 1篇
EXCEL
Python 20篇
Web crawling 4篇
Linux 11篇
AI 5篇
windows 2篇

最新评论

华为 OpenEuler OS 上操作 Nvidia A100 做 LLama2 开发（1）
m0_74097121: 打不开https://ai.meta.com/resources/models-and-libraries/llama-downloads/怎么办呢
Jupyter notebook 远程配置及SSL加密
YASEBER: 这里提供一下官方文档给好奇的同学： https://jupyter-server.readthedocs.io/en/latest/operators/public-server.html#running-a-public-jupyter-server网页中的 Using SSL for encrypted communication小节。
Centos7 环境中 MariaDB 重新设置 root 密码
南风知意: 确实好用
Docker 全攻略
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/614713533。
Pytorch VS TensorFlow （2020年最新对比）
Engineer.C: 有Pytorch和CNTK训练速度对比吗，哪个更快呢？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。