过拟合、正则化、泛化、归一化

最新推荐文章于 2024-05-09 20:26:02 发布

凌疯墨子

最新推荐文章于 2024-05-09 20:26:02 发布

阅读量3k

点赞数 2

分类专栏：自然语言处理文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ANNILingMo/article/details/80222797

版权

1、什么是过拟合

过拟合现象：通常我们在分类任务过程中都会遇到过拟合这种现象，具体表现为，当我们增加训练集的数据时，测试集的分类效果反而降低，这种现象称为过拟合，或者叫过配。

过拟合的本质：是由于监督学习问题的不稳定，表现为三点

（1）、有限的训练数据不能完全反映出一个模型的好坏，然而我们不得不在这有限的数据集上挑选模型，因此我们完全有可能挑选到训练集上表现好而在测试集上表现很差的模型，也无法知道模型在测试集上的表现。

（2）、如果模型空间（也叫模型复杂度）足够，当我们有很多待选模型的时候，我们挑到和任务数据集对应最好的模型的概率就小得多了。

（3）、如果我们想训练集的效果表现很好，就需要挑选足够多的模型，否则模型空间很小，就很可能不存在能够拟合很好的模型。

2、正则化为什么能够防止过拟合

在机器学习中，数据中往往会存在噪声，当我们用模型去拟合带有噪声的数据时，往往将模型便得更加复杂而正则化和惩罚因子，目的是为了平衡模型复杂度和损失函数之间的关系，从而得到更优的测试结果。为了解释正则化，我准备引入一个公式来阐述正则化的概念。假设目标函数如：

$min\left\{ \frac{1}{N}\sum_{i=1}^{N}{(y_{i} - f(x_{i} ))^{2} + r(d)} \right\}$ , 为了让目标函数值最小。其中，r(d)可以理解为有d的参数进行约束，或者 D 向量有d个维度。

咱们可以令: f( $x_{i}$ ) =

最低0.47元/天解锁文章

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
过拟合、正则化、泛化、归一化

1、什么是过拟合过拟合现象：通常我们在分类任务过程中都会遇到过拟合这种现象，具体表现为，当我们增加训练集的数据时，测试集的分类效果反而降低，这种现象称为过拟合，或者叫过配。过拟合的本质：是由于监督学习问题的不稳定，表现为三点（1）、有限的训练数据不能完全反映出一个模型的好坏，然而我们不得不在这有限的数据集上挑选模型，因此我们完全有可能挑选到训练集上表现好而在测试集上表现很差的模型，也无法知道模型在...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。