深度学习笔记(六)：过拟合是什么意思

最新推荐文章于 2024-04-28 22:14:47 发布

放不完的风筝

最新推荐文章于 2024-04-28 22:14:47 发布

阅读量3.1w

点赞数 8

分类专栏：深度学习文章标签： deeplearning 机器学习深度学习过拟合

本文链接：https://blog.csdn.net/u012950413/article/details/80376136

版权

深度学习专栏收录该内容

10 篇文章 19 订阅

订阅专栏

overfitting过拟合

过拟合:表示神经网络模型在训练集上的表现很好，但是泛化能力比较差，在测试集上表现不好

overfitting的例子:

这里写图片描述

横坐标为x，纵坐标为y,每个黑点为训练集的训练实例,红色线条是我们训练得出的方程，可以看出
训练的模型能够完美的拟合训练集的实例。而黑色的虚线方程也可以比较好的拟合我们的训练实例。

黑色方程好还是红色方程好?

红色线段虽然完美的拟合的训练实例，但是如果在测试集出现一个点，比如(0.4,0.5)，这个点离我们红色的曲线相差很远，而离黑色曲线很近。这个说明了虽然模型在训练集效果很好，但是在测试集表现比较差，泛化能力很差，而相对的黑色曲线的泛化能力就比较强。这就是过拟合(overfitting)

实验, 假设MNIST只用1,000个来训练(依然沿用之前的程序，请参考>手写识别的demo

>>> import mnist_loader 
>>> training_data, validation_data, test_data = \
... mnist_loader.load_data_wrapper()
>>> import network2 
>>> net = network2.Network([784, 30, 10], cost=network2.CrossEntropyCost) 
>>> net.large_weight_initializer()
>>> net.SGD(training_data[:1000], 400, 10, 0.5, evaluation_data=test_data,
... monitor_evaluation_accuracy=True, monitor_training_cost=True)