PyTorch中在反向传播前为什么要手动将梯度清零？optimizer.zero_grad()的意义

最新推荐文章于 2024-05-16 11:09:42 发布

计算机视觉-杨帆

最新推荐文章于 2024-05-16 11:09:42 发布

阅读量4.5k

点赞数 5

文章标签： python 人工智能 pytorch 神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/whiffeyf/article/details/105053952

版权

optimizer.zero_grad()意思是把梯度置零，也就是把loss关于weight的导数变成0.

在学习pytorch的时候注意到，对于每个batch大都执行了这样的操作：

optimizer.zero_grad()             ## 梯度清零
preds = model(inputs)             ## inference
loss = criterion(preds, targets)  ## 求解loss
loss.backward()                   ## 反向传播求解梯度
optimizer.step()                  ## 更新权重参数

1,由于pytorch的动态计算图，当我们使用loss.backward()和opimizer.step()进行梯度下降更新参数的时候，梯度并不会自动清零。并且这两个操作是独立操作。

2,backward()：反向传播求解梯度。

3,step()：更新权重参数。

基于以上几点，正好说明了pytorch的一个特点是每一步都是独立功能的操作，因此也就有需要梯度清零的说法，如若不显示的进 optimizer.zero_grad()这一步操作，backward()的时候就会累加梯度。

计算机视觉-杨帆

关注

5
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
PyTorch中在反向传播前为什么要手动将梯度清零？optimizer.zero_grad()的意义

optimizer.zero_grad()意思是把梯度置零，也就是把loss关于weight的导数变成0.在学习pytorch的时候注意到，对于每个batch大都执行了这样的操作：optimizer.zero_grad() ## 梯度清零preds = model(inputs) ## inferenceloss = criterion(pr...
复制链接

扫一扫

计算机视觉-杨帆 CSDN认证博客专家 CSDN认证企业博客

码龄7年

197: 原创

2万+: 周排名

5457: 总排名

68万+: 访问

: 等级

5818: 积分

1567: 粉丝

998: 获赞

1014: 评论

5121: 收藏

私信

关注

热门文章

分类专栏

pytorch 7篇
mmacion2 1篇
slowfast 1篇
mmaction
2
卷积神经网络 13篇
yolo 9篇
机械臂 2篇
机器人 6篇
ros 16篇
moveit 2篇
gazebo 7篇
python 10篇
format 2篇
view 1篇
nn.Linear 1篇
池化层 1篇
nn.MaxPool 1篇
nn.MaxPool1d
nn.conv1d 1篇
nn.conv2d 1篇
kolourpaint 1篇
variable 1篇
tensor 1篇
神经网络 1篇
yolov3 1篇
目标检测 2篇
fcn 1篇
算法 2篇

最新评论

2023 安装 facebookresearch slowfast 自定义数据集训练 yolo数据集转ava数据集
七城绝恋: File "/home/xxx/SlowFast/slowfast/datasets/loader.py", line 114, in construct_loader dataset = build_dataset(dataset_name, cfg, split) File "/home/xxx/SlowFast/slowfast/datasets/build.py", line 31, in build_dataset return DATASET_REGISTRY.get(name)(cfg, split) File "/home/xxx/SlowFast/slowfast/datasets/ava_dataset.py", line 47, in __init__ self._load_data(cfg) File "/home/xxx/SlowFast/slowfast/datasets/ava_dataset.py", line 63, in _load_data boxes_and_labels = ava_helper.load_boxes_and_labels( File "/home/xxx/SlowFast/slowfast/datasets/ava_helper.py", line 101, in load_boxes_and_labels all_boxes, count, unique_box_count = parse_bboxes_file( File "/home/xxx/SlowFast/slowfast/datasets/ava_helper.py", line 222, in parse_bboxes_file if box_key not in all_boxes[video_name][frame_sec]: KeyError: 2 想问一下啊，这个错是什么意思
【slowfast 训练自己的数据集】自定义动作，制作自己的数据集，使用预训练模型进行训练，并检测其结果
undefeatedsoul: File "d:\pycharm\pythonproject\slowfast-main\slowfast\datasets\ava_helper.py", line 46, in load_image_lists assert len(row) == 5 有没有大佬帮忙解决下，我也检查了train .csv，但是他就是五列数据，没有错误，究竟是什么原因引起的 AssertionError
自定义ava数据集及训练与测试完整版时空动作/行为视频数据集制作 yolov5, deep sort, VIA MMAction, SlowFast
砚579: 我也打不开
【slowfast 减少ava数据集】将ava数据集缩小到2个，对数据集做训练，然后进行检测，为训练自己的数据集做准备
叼烟的女人抽了我: 能否提供一下构建的数据集，按照流程走完之后在训练阶段报错，在ava_dataset.py 报KeyError： '“-5KQ66BBWC4'，我想看看我在数据集构建有什么问题，邮箱：[email protected]
【slowfast 减少ava数据集】将ava数据集缩小到2个，对数据集做训练，然后进行检测，为训练自己的数据集做准备
叼烟的女人抽了我: 请问一下，训练的时候出现 KeyError： '“-5KQ66BBWC4'，怎么回事呢？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。