TensorFlow 入门教程（六） —— 过拟合（overfitting）的解决方法dropout

最新推荐文章于 2023-08-25 18:03:45 发布

TJU师姐

最新推荐文章于 2023-08-25 18:03:45 发布

阅读量423

点赞数

分类专栏： TensorFlow学习教程文章标签：可视化机器学习 tensorflow 人工智能

本文链接：https://blog.csdn.net/qq_42535133/article/details/105807726

版权

TensorFlow学习教程专栏收录该内容

14 篇文章 2 订阅

订阅专栏

什么是overfitting？

在机器学习领域，overfitting是一个很常见的问题。如下图，是一个classification问题，正常预测情况应该是，黑色线右边为蓝色区域，海色先左边为红色区域，如果机器学习过于“充分”，用绿色的线非常精准的划分区域，在平常生活中比你高没有黑色线区分效果明显，也就是说黑色线实用性更强。所以，应该尽量避免让机器学习成绿色曲线，黑色曲线更优。
在这里插入图片描述

进一步理解，如下图三幅图像，左边的拟合曲线不能较好地表示预测情况，右边的拟合曲线过拟合，中间的拟合曲线则是较为理想的状况。
在这里插入图片描述

在tensorflow中如何实现避免 overfitting 呢？

tensorflow中提供了一个强大的功能——dropout，具体实现方法如下：

1 定义 keep_prob （drop保留的比率）并为其占位

keep_prob = tf.placeholder(tf.float32)  #保持部分结果不被dropout

2 为输出加入dropout

 Wx_plus_b = tf.nn.dropout(Wx_plus_b, keep_prob)#drop掉Wx_plus_b的百分之50的结果

3 将 dropout 载入sess中，训练过程选择随机保留部分神经元，训练与测试输出无dropout，全部保留

for i in range(500):
    # here to determine the keeping probability
    sess.run(train_step, feed_dict={xs: X_train, ys: y_train, keep_prob: 0.5})#载入keep_prob，训练保留的比例为0.5
    if i % 50 == 0:
        # record loss
        train_result = sess.run(merged, feed_dict={xs: X_train, ys: y_train, keep_prob: 1}) #训练结果全部保留，不drop任何数据
        test_result = sess.run(merged, feed_dict={xs: X_test, ys: y_test, keep_prob: 1})
        train_writer.add_summary(train_result, i)
        test_writer.add_summary(test_result, i)