能否说出几种降低过拟合和欠拟合风险的方法?

最新推荐文章于 2024-01-31 16:59:12 发布

GhostintheCode

最新推荐文章于 2024-01-31 16:59:12 发布

阅读量1.5k

点赞数

分类专栏：机器学习面试文章标签：过拟合

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/GhostintheCode/article/details/104614504

版权

面试同时被 2 个专栏收录

29 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

文章目录

过拟合
欠拟合

过拟合

1、数据入手，获得更多数据
2、降低模型复杂度
3、正则化方法
4、集成学习方法

数据入手，获得更多数据

使用更多的训练数据是解决过拟合问题最有效的手段，因为更多的样本能够让模型学习到更多更有效的特征，减小噪声的影响。当然，直接增加实验数据一般是很困难的，但是可以通过一定的规则来扩充训练数据。比如，在图像分类的问题上，可以通过图像的平移、旋转、缩放等方式扩充数据;更进一步地，可以使用生成式对抗网络来合成大量的新训练数据。

降低模型复杂度

在数据较少时，模型过于复杂是产生过拟合的主要因素，适当降低模型复杂度可以避免模型拟合过多的采样噪声。例如，在神经网络模型中减少网络层数、神经元个数等;在决策树模型中降低树的深度、进行剪枝等。

正则化方法

正则化方法。给模型的参数加上一定的正则约束，比如将权值的大小加入到损失函数中。以L2正则化为例:

这样，在优化原来的目标函数C0的同时，也能避免权值过大带来的过拟合风险。

集成学习方法

集成学习是把多个模型集成在一起，来降低单一模型的过拟合风险，如Bagging方法。

欠拟合

1、添加新特征
2、增加模型复杂度（与过拟合对应）
3、减小正则化系数（与过拟合对应）

添加新特征

当特征不足或者现有特征与样本标签的相关性不强时，模型容易出现欠拟合。通过挖掘“上下文特征”“ID类特征”“组合特征”等新的特征，往往能够取得更好的效果。在深度学习潮流中，有很多模型可以帮助完成特征工程，如因子分解机、梯度提升决策树、Deep-crossing等都可以成为丰富特征的方法。

增加模型复杂度

简单模型的学习能力较差，通过增加模型的复杂度可以使模型拥有更强的拟合能力。例如，在线性模型中添加高次项，在神经网络模型中增加网络层数或神经元个数等。

减小正则化系数

正则化是用来防止过拟合的，但当模型出现欠拟合现象时，则需要有针对性地减小正则化系数

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
能否说出几种降低过拟合和欠拟合风险的方法?

文章目录过拟合数据入手，获得更多数据降低模型复杂度正则化方法集成学习方法欠拟合添加新特征增加模型复杂度减小正则化系数过拟合1、数据入手，获得更多数据2、降低模型复杂度3、正则化方法4、集成学习方法数据入手，获得更多数据使用更多的训练数据是解决过拟合问题最有效的手段，因为更多的样本能够让模型学习到更多更有效的特征，减小噪声的影响。当然，直接增加实验数据一般是很困难的，但是可以通过一...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。