模型选择+过拟合和欠拟合

最新推荐文章于 2024-07-25 23:06:58 发布

王三省的读研日记

最新推荐文章于 2024-07-25 23:06:58 发布

阅读量488

点赞数

分类专栏：动手学深度学习pytorch版跟李沐学AI 文章标签：深度学习机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40694497/article/details/122648327

版权

动手学深度学习pytorch版同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

7 篇文章 0 订阅

订阅专栏

目录

训练误差和泛化误差

k-折交叉验证

过拟合和欠拟合

模型容量：

模型容量的影响

估计模型容量

模型选择

训练误差和泛化误差

简单理解：验证数据集没有参加训练，所以可以在一定程度上反映超参数的好坏。

训练误差 --->测试数据集

泛化误差 --->验证数据集

不要把测试集和验证集混用。

k-折交叉验证

简单理解：

把一个数据集分成k块，第i块作为验证数据集，其余作为训练数据集。

重复k次，计算每次验证集的平均误差。

k折交叉验证适用于不大的数据集。

总结：

过拟合和欠拟合

根据数据集的简单和复杂选择对应模型的容量。

如果数据过于简单，应该选择比较低的模型容量，否则，会出现过拟合。

eg：在一个很简答的数据集中用一个特别深的神经网络，就会导致会把每一个样本全部记住，导致看到新样本没有泛化性，从而出现过拟合的情况。

如果数据特别复杂，应选择比较高的模型容量，否则，会出现欠拟合。

eg：在一个比较复杂的数据集中，假设模型容量比较低，精度不够，不能很好的训练数据，从而出现欠拟合。

模型容量：

模型容量的影响

假设模型容量比较低，训练误差会比较高，泛化误差同样会比较高。

随着模型容量的增加，训练误差开始下降，最低理论上可以下降到0。

泛化误差一开始会随之下降，但是下降到某一个点之后，开始缓慢的往上升，这是由于模型过于关注细节，但是数据中存在较多的噪音，导致受到某些无关的噪音干扰，会对泛化误差产生于不好的影响。

深度学习的核心：先保证模型可以容量足够大的前提下，通过控制模型的容量，使得得到不断下降的泛化误差。

估计模型容量

VC维

vc维的好处：

数据复杂度

总结：

王三省的读研日记

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
模型选择+过拟合和欠拟合

目录模型选择训练误差和泛化误差k-折交叉验证总结：过拟合和欠拟合模型容量：模型容量的影响估计模型容量VC维总结：模型选择训练误差和泛化误差简单理解：验证数据集没有参加训练，所以可以在一定程度上反映超参数的好坏。训练误差 --->测试数据集泛化误差 --->验证数据集不要把测试集和验证集混用。k-折交叉验证简单理解：把一个数据集分成k块，第i块作为验证数据集，其余作为训练数据集。重复k次，...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。