caffe + python + float 产生 Inf ，从而触发NaN

最新推荐文章于 2024-06-27 15:13:27 发布

机器学习的小学生

最新推荐文章于 2024-06-27 15:13:27 发布

阅读量971

点赞数

分类专栏： Caffe

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/raby_gyl/article/details/80676291

版权

Caffe 专栏收录该内容

47 篇文章 2 订阅

订阅专栏

损失函数在训练过程中，如果在刚开始的迭代过程中损失函数就发散变为了Inf 或者NaN，那么往往可以通过调节学习率来解决。

另外一种情况是在迭代了数千次，例如我迭代了1800次，忽然出现损失函数为Inf或者NaN的情况，在我的实验情况下是由于caffe的python接口使用的是单精度float类型，在自己用python定义的层中，使用到了指数函数np.exp(a)，当a的值超过某个数时例如90，使用单精度无法表示，就产生了Inf值。解决方法是在自己定义的python层中将bottom[0].data或者其他都转化为double类型然后再操作。

后续… 对于一些数值（如e^90），虽然能够利用双精度表示了，但是再进一步的迭代过程中出现了更大的数据，例如(e^710) ，即上一层产生的激活值大于710，导致 e^710 会产生溢出。现在问题还未解决….

机器学习的小学生

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

机器学习的小学生 CSDN认证博客专家 CSDN认证企业博客

码龄15年

237: 原创

9万+: 周排名

232万+: 总排名

119万+: 访问

: 等级

1万+: 积分

476: 粉丝

336: 获赞

102: 评论

1252: 收藏

私信

关注

热门文章

分类专栏

最新评论

计算梯度的三种方法：数值法，解析法，反向传播法
CatCatDogDog2030: 3年过去了，请问你知道答案了么？我看文章中大部分都是用解析法的，即使是反向传播的方式(实际上只是用来链式法则）也是解析法的损失函数的表达式是明确且可微，应该就是用解析法了
ADMM算法求解一个简单的例子
m0_73335314: 怎么拆呢怎么还是运行不了呢
Matlab中不同包中同名函数的调用
Riflef**keverybody: 我是在matlab的添加附加程序中安装了compiler导致clc和其他几个built in函数重名，我用楼主的方法which clc后发现现在matlab使用的是compiler\deploy中的clc函数，把deploy移除路径之后恢复正常了，只是不知道compiler还能不能正常运行，后续我再检查一下，感谢楼主的分享！
Matlab中不同包中同名函数的调用
yangning7777777: 我的matlab开机时，出现如下信息：警告: 函数 assert 与某个 MATLAB 内置函数同名。建议您重命名该函数以避免潜在的名称冲突。警告: 函数 isscalar 与某个 MATLAB 内置函数同名。建议您重命名该函数以避免潜在的名称冲突。警告: 函数 isvector 与某个 MATLAB 内置函数同名。建议您重命名该函数以避免潜在的名称冲突。并且有时在查看变量时会弹出错误窗口： readonly 错误：表达式无效。请检查缺失的乘法运算符、缺失或不对称的分隔符或者其他语法错误。要构造矩阵，请使用方括号而不是圆括号 workspacefunc 350 搜索了很多，只有这个有疗效，对了，那个addpath好像不用弄也可以。大爱博主，我单身。
GPML toolbox -- document
ASLS_Shen: 老哥解决了吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。