模型选择、欠拟合和过拟合

禅衣

于 2021-09-23 21:16:37 发布

阅读量259

点赞数

CC 4.0 BY-SA版权

分类专栏：动手学深度学习+pytorch 文章标签：机器学习深度学习神经网络

原文链接：https://zh-v2.d2l.ai/

动手学深度学习+pytorch 专栏收录该内容

30 篇文章

订阅专栏

本文探讨了机器学习中过拟合的概念及其对抗手段——正则化，并介绍了影响模型泛化的关键因素，包括可调整参数数量、参数取值范围及训练样本数量等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

只有模型真正发现了一种泛化模式，才会作出有效预测

如何发现可以泛化的模式是机器学习的根本问题

将模型在训练数据上拟合得比在潜在分布中更接近的现象称为过拟合，用于对抗过拟合的技术称为正则化

有时会发现，在实验中，调整模型结构或超参数，会发现，如果有足够多的神经元、层数和训练迭代周期，模型最终可以在训练集上到达完美的精度，此后四测试集上的准确性却下降

训练误差和泛化误差

为了进一步了解上述现象，需要了解训练误差和泛化误差，训练误差是指模型在训练数据集上计算得到的误差。泛化误差是指将模型应用在同样从原始样本的分布中抽取的无限多的数据样本时，我们模型误差的期望

我们永远不能准确地计算出泛化误差，在实际中，我们只能通过将模型应用于一个独立的测试集来估计泛化误差，该测试集由随机选取的、未曾在训练集中出现的数据样本构成

影响模型泛化的因素：

可调整参数的数量。当可调整参数的数量（有时称为自由度）很大时，模型往往更容易过拟合。
参数采用的值。当权重的取值范围较大时，模型可能更容易过拟合。
训练样本的数量。即使你的模型很简单，也很容易过拟合只包含一两个样本的数据集。而过拟合一个有数百万个样本的数据集则需要一个极其灵活的模型。

欠拟合和过拟合

影响因素：数据集的大小、模型的复杂性

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。