机器学习——防止过拟合

最新推荐文章于 2023-08-20 11:42:10 发布

seu_yang

最新推荐文章于 2023-08-20 11:42:10 发布

阅读量802

点赞数

分类专栏：挖掘算法文章标签：数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/seu_yang/article/details/52456744

版权

挖掘算法专栏收录该内容

7 篇文章 2 订阅

订阅专栏

所谓过拟合就是由于过度学习训练样本，而导致该模型眼里容不下别的样本，从而对训练样本之外的样本接受能力差，导致模型无法具有很好的泛化能力。防止过拟合的方法有多种，上一篇文章中结构风险最小化提到的正则化项，就是为了防止模型过拟合，模型复杂度过大的一个模型修正条件。

从样本上来说：增加样本的全面性和数量

从模型上来说：训练模型的同时限制模型复杂度，增加1范数和2范数，如线性回归的优化岭回归

从训练手段上来说：有提前预防型：early stop；有事后修正型：dropout，剪枝等

1.所谓early stopping，即在每一个epoch结束时（一个epoch即对所有训练数据的一轮遍历）计算 validation data的accuracy，当accuracy不再提高时，就停止训练。当然这个不提高通常是指连续增加多次训练，例如10次训练后发现正确率不再提升则停止训练。

2.所谓dropout，dropout是指在深度学习网络的训练过程中，对于神经网络单元，按照一定的概率将其暂时从网络中丢参考 http://blog.csdn.net/stdcoutzyx/article/details/49022443

3.树模型通常会对一棵很大的树进行剪枝

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习——防止过拟合

所谓过拟合就是由于过度学习训练样本，而导致该模型眼里容不下别的样本，从而对训练样本之外的样本接受能力差，导致模型无法具有很好的泛化能力。防止过拟合的方法有多种，上一篇文章中结构风险最小化提到的正则化项，就是为了防止模型过拟合，模型复杂度过大的一个模型修正条件。从样本上来说：增加样本的全面性和数量从模型上来说：训练模型的同时限制模型复杂度，增加1范数和2范数，如线性回归的优化岭回归从训练
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。