神经网络参数初始化及训练过程loss出现NAN的解决方法

最新推荐文章于 2023-03-21 17:42:09 发布

拉轰小郑郑

最新推荐文章于 2023-03-21 17:42:09 发布

阅读量1.7k

点赞数 2

分类专栏： pytorch python 深度学习原理文章标签： python 深度学习神经网络 NAN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/snowsnowsnow1991/article/details/109073702

版权

pytorch 同时被 3 个专栏收录

6 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

深度学习原理

1 篇文章 0 订阅

订阅专栏

一、

最近在修改代码后，训练过程loss出现NAN，而且概率很大，于是查找原因，在此记录。

在给信号按照相应信噪比加噪声的过程中，增加了部分代码，且增加了batch norm，但是训练过程中大概率loss会出现NAN。

增加噪声的代码如下：

1 def wgn(x, snr):
2 P_signal = np.sum(abs(x)**2)/len(x)
3 　 P_noise = P_signal/10**(snr/10.0)
4 　 return np.random.randn(len(x)) * np.sqrt(P_noise)

根据查到的资料，先后怀疑过是学习率，batch norm的过程，最后查到是代码中出现开平方的过程，sqrt(P_noise)，而P_noise接近于零导致。

故在sqrt前，给P_noise加上一个小数，变为sqrt(P_noise+0.00001)，此问题解决。

此过程参考的资料如下：

https://blog.csdn.net/weixin_44191286/article/details/86437924

https://blog.csdn.net/github_36923418/article/details/103010097

https://blog.csdn.net/qq_34914551/article/details/99992341

二、

给权重参数初始化

1.单层网络的情况：

xavier更适合tanh激活函数

torch.nn.init.xavier_normal(tensor, gain=1)

例如：

w = torch.Tensor(3, 5)
nn.init.xavier_normal(w)

kaiming更适合relu

torch.nn.init.kaiming_normal(tensor, a=0, mode='fan_in')

例如：

w = torch.Tensor(3, 5)
nn.init.kaiming_normal(w, mode='fan_out')

2.自定义多层网络：

在__init__中迭代循环self.modules()来初始化网络参数

参考的资料如下：

https://blog.csdn.net/dss_dssssd/article/details/83959474

https://blog.csdn.net/dss_dssssd/article/details/83990511

拉轰小郑郑

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
神经网络参数初始化及训练过程loss出现NAN的解决方法

一、最近在修改代码后，训练过程loss出现NAN，而且概率很大，于是查找原因，在此记录。在给信号按照相应信噪比加噪声的过程中，增加了部分代码，且增加了batch norm，但是训练过程中大概率loss会出现NAN。增加噪声的代码如下：1 def wgn(x, snr):2 P_signal = np.sum(abs(x)**2)/len(x)3 　 P_noise = P_signal/10**(snr/10.0)4 　 return np....
复制链接

扫一扫

专栏目录

拉轰小郑郑 CSDN认证博客专家 CSDN认证企业博客

码龄13年

9: 原创

8万+: 周排名

197万+: 总排名

20万+: 访问

: 等级

2084: 积分

29: 粉丝

114: 获赞

34: 评论

430: 收藏

私信

关注

热门文章

分类专栏

最新评论

C语言关于补码的解释及误区
汐华初流乃260: 多谢
torch.nn.Conv1d及一维卷积举例说明
Ben出没冇注意: 非常好的图！！！！！！！！！！！！！！
delete一个指针之后,要记得设置为NULL
发条哥: new是申请堆空间中的内存。 int *p是指向你申请的堆空间内存中的4个字节，比如地址0X01 0X02 0X03 0X04,你赋值的数据存放在这4个字节当中。 p是这4个字节的首地址，0x01。 delete释放的只是以p开头的4个字节的数据。这时候指针的指向没有发生改变，还是指向的那4个字节。然后又申请了堆空间内存。系统又给你了0X01 0X02 0X03 0X04(系统找出4个连续的地址给你，可能会是你用过的那一段，因为你已经用完还给了系统) int *p1是指向你申请的堆空间内存中的4个字节。 p1是这4个字节的首地址，0x01 这时候你int*p和int*p1指向的是同一段数据。你修改*p的值就是往那一段数据中写入23。 *p1指向的也是23这段数据。
torch.nn.Conv1d及一维卷积举例说明
不堪沉沦: 图给我直接点醒了，感谢
torch.nn.Conv1d及一维卷积举例说明
＆ Pumbaa: 博主应该是写反啦，卷积核的大小应该是4*3

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。