mxnet学习(3):autograd

最新推荐文章于 2024-07-05 10:17:58 发布

_rookie_coder

最新推荐文章于 2024-07-05 10:17:58 发布

阅读量2.5k

点赞数

分类专栏： mxnet 文章标签： mxnet autograd

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_20622615/article/details/88633689

版权

这篇博客主要介绍了MXNet中的Autograd模块，包括基本操作如如何计算梯度，以及BN和dropout的使用区别。在训练和测试过程中，BN和dropout的处理方式不同，Autograd提供了相应的控制手段。此外，还提到了在特定情况下如何暂停保存梯度。

摘要由CSDN通过智能技术生成

reference:https://mxnet.incubator.apache.org/api/python/autograd/autograd.html

1.基本操作

使用x.attach_grad()为梯度分配空间，调用with autograd.record()计算梯度，再使用backward()进行反传

2. BN and dropout

BN, dropout这些层在训练和测试的时候是不同的，BN在训练的时候是根据每个mini-batch的均值和方差进行计算并更新参数，在测试的时候是使用训练集上得到的一个参数进行计算。dropout在测试的时候是没有的。因此需要在不同的时候加以区别（这一点在pytorch中也是存在）。

使用with autograd.record():，默认为train_mode = True

也可以使用with autograd.train_mode(),with autograd.predict_mode()或者with autograd.record(train_mode = False)等方式手动控制

3. pause

可以在with autograd.record():中使用with autograd.pause()暂停保存梯度.

eg:

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
mxnet学习(3):autograd

reference:https://mxnet.incubator.apache.org/api/python/autograd/autograd.html1.基本操作使用x.attach_grad()为梯度分配空间，调用with autograd.record()计算梯度，再使用backward()进行反传2. BN and dropoutBN, dropout这些层在训练和测试的时候是...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。