[解决]神经网络训练过程中loss中出现Non

不懂还要搞机器学习的咸鱼

于 2023-05-06 10:54:25 发布

阅读量246

点赞数

文章标签：神经网络深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/azheng02/article/details/130521767

版权

该循环中batch_size=64,取

i=0-->[0, 63],

i=64-->[64, 127]

....

训练正常，当进行到

i=320-->[320, 383]的循环中，loss出现nan的情况

原因：梯度爆炸

reference该文章讲的较为清晰，我只是从表面概括下

可以发现，在i=256时，梯度的参数出现较大的情况，如

e+16,e+17等较大的值

方法

batch_size=64--->改为32

注：我只尝试了这一种方法，同样也可以调整学习率、对数据集进行归一化、标准化处理等方法，要是改变batch_size的方法失效，我再试试其他方法，到时再来补充。

不懂还要搞机器学习的咸鱼

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
[解决]神经网络训练过程中loss中出现Non

注：我只尝试了这一种方法，同样也可以调整学习率、对数据集进行归一化、标准化处理等方法，要是改变batch_size的方法失效，我再试试其他方法，到时再来补充。i=320-->[320, 383]的循环中，loss出现nan的情况。可以发现，在i=256时，梯度的参数出现较大的情况，如。batch_size=64--->改为32。该循环中batch_size=64,取。该文章讲的较为清晰，我只是从表面概括下。e+16,e+17等较大的值。
复制链接

扫一扫

不懂还要搞机器学习的咸鱼 CSDN认证博客专家 CSDN认证企业博客

码龄2年

16: 原创

129万+: 周排名

213万+: 总排名

1万+: 访问

: 等级

174: 积分

2: 粉丝

9: 获赞

7: 评论

29: 收藏

私信

关注

热门文章

最新评论

【知识点】信道路径衰落分类、计算公式、换算
羽翼蝉: 可以根据香农公式
【知识点】信道路径衰落分类、计算公式、换算
理发贴膜且电工: 博主，请问SNR = P*G/N0这个公式是如何得出的呀
【解决】 module ‘torchvision.transforms’ has no attribute ‘RandomResizedCrop’
weixin_50197452: 直接给我环境全搞乱了
【知识点】信道路径衰落分类、计算公式、换算
adiaoa: 博主，论文中出现的路径损耗-128.1 - 37.6 log10(d)，这是为什么？Pr-Pt吗？还是什么情况？
【解决】AttributeError: ‘torch.device‘ object has no attribute ‘_apply‘
CSDN-Ada助手: 恭喜您写出了这篇有价值的博客！您的解决方法对于遇到类似问题的读者来说无疑是非常有帮助的。希望您能够继续分享您的经验和知识，让更多的人受益。在下一篇博客中，您可以尝试分享一些实战经验或者介绍一些新的工具或技术，这样会更加吸引人哦！加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。