tensorflow之过拟合

最新推荐文章于 2020-10-23 16:16:25 发布

Terry无敌

最新推荐文章于 2020-10-23 16:16:25 发布

阅读量2.5k

点赞数

分类专栏： TensorFlow系列

本文链接：https://blog.csdn.net/tengxing007/article/details/54293687

版权

TensorFlow系列专栏收录该内容

21 篇文章 2 订阅

订阅专栏

在神经网络训练中，我们不断的训练，可以得到更符合预期的特征值。但是，训练过度，会产生一个什么效应呢，就是过拟合，英文好像叫overfitting.用人来做比喻，适当的自信很重要，但是自信过度就变成了自负，过拟合和自负差不多。这样会造成很大的误差。

用一个图来理解：

第一张到第二张为正常学习，再到第三张，显然已经弯曲了，不符合预期效果，因此，避免过拟合尤为重要。如何避免了？

我最先想到的是减少训练的次数，可能是训练次数过多，这是很容易想到的；再就是训练的数据量，增大数据量。但是这些都并不能从根本上解决这个问题。

官方文单上提供了一个非常好的工具--dropout来解决这个问题，只需要给予它一个不被 drop 掉的百分比，就能很好地降低 overfitting。dropout是指在深度学习网络的训练过程中，对于神经网络单元，按照一定的概率将其暂时从网络中丢弃。注意是暂时，对于随机梯度下降来说，由于是随机丢弃，故而每一个mini-batch都在训练不同的网络，简单点说就是说有的数据抛弃不要。

下面来个例子说一下这个工具的基本使用：

def dropout(input, keep_prob):
    return tf.nn.dropout(input, keep_prob)
keep_prob = tf.placeholder(tf.float32)

intput通常为权重与偏执的函数关系

keep_prob是drop率，一般0.5的时候效果最好，原因是有大神交叉验证过，说0.5的时候dropout随机生成的网络结构最多，看下面的图。

这是我转的一篇深入理解过拟合的博客，可以看看，点击这里

Terry无敌

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录