python为什么会出现nan_tensorflow训练中出现nan问题的解决

最新推荐文章于 2022-01-26 18:37:31 发布

weixin_39607837

最新推荐文章于 2022-01-26 18:37:31 发布

阅读量914

点赞数

文章标签： python为什么会出现nan

在深度学习的网络训练过程中，输入数据未归一化可能导致预测错误，进而造成权重和偏置值溢出，出现NaN。解决办法包括数据归一化、批量归一化、初始化权重、选择激活函数和调整学习率。本文通过TensorFlow实现了一个简单的例子，展示了数据预处理和训练过程，以防止NaN的出现。

摘要由CSDN通过智能技术生成

深度学习中对于网络的训练是参数更新的过程，需要注意一种情况就是输入数据未做归一化时，如果前向传播结果已经是[0,0,0,1,0,0,0,0]这种形式，而真实结果是[1,0,0,0,0,0,0,0,0]，此时由于得出的结论不惧有概率性，而是错误的估计值，此时反向传播会使得权重和偏置值变的无穷大，导致数据溢出，也就出现了nan的问题。

解决办法：

1、对输入数据进行归一化处理，如将输入的图片数据除以255将其转化成0-1之间的数据;

2、对于层数较多的情况，各层都做batch_nomorlization;

3、对设置Weights权重使用tf.truncated_normal(0, 0.01, [3,3,1,64])生成，同时值的均值为0，方差要小一些;

4、激活函数可以使用tanh;

5、减小学习率lr。

实例：

import tensorflow as tf

from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets('data',one_hot = True)

def add_layer(input_data,in_size, out_size,activation_function=None):

Weights = tf.Variable(tf.random_normal([in_size,out_size]))

Biases = tf.Variable(tf.zeros([1, out_size])+0.1)

Wx_plus_b = tf.add(tf.ma

最低0.47元/天解锁文章

weixin_39607837

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python为什么会出现nan_tensorflow训练中出现nan问题的解决

深度学习中对于网络的训练是参数更新的过程，需要注意一种情况就是输入数据未做归一化时，如果前向传播结果已经是[0,0,0,1,0,0,0,0]这种形式，而真实结果是[1,0,0,0,0,0,0,0,0]，此时由于得出的结论不惧有概率性，而是错误的估计值，此时反向传播会使得权重和偏置值变的无穷大，导致数据溢出，也就出现了nan的问题。解决办法：1、对输入数据进行归一化处理，如将输入的图片数据除以255...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。