ML - 解决欠拟合和过拟合

最新推荐文章于 2021-07-28 09:38:08 发布

G____G

最新推荐文章于 2021-07-28 09:38:08 发布

阅读量297

点赞数

分类专栏： MachineLearning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/g____g/article/details/104789399

版权

MachineLearning 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

模型欠拟合：在训练集以及测试集上同时具有较高的误差，此时模型的偏差较大；
模型过拟合：在训练集上具有较低的误差，在测试集上具有较高的误差，此时模型的方差较大。

如何解决欠拟合：

添加其他特征项。组合、泛化、相关性、上下文特征、平台特征等特征是特征添加的重要手段，有时候特征项不够会导致模型欠拟合。
可以增加模型的复杂程度。例如将线性模型添加二次项或三次项使模型泛化能力更强。例如，FM（Factorization Machine）模型、FFM（Field-aware Factorization Machine）模型，其实就是线性模型，增加了二阶多项式，保证了模型一定的拟合程度。
减小正则化系数。正则化的目的是用来防止过拟合的，但是现在模型出现了欠拟合，则需要减少正则化参数。

如何解决过拟合：

重新清洗数据，数据不纯会导致过拟合，此类情况需要重新清洗数据。
增加训练样本数量。
降低模型复杂程度。神经网络可以减少网络层数、神经元个数；决策树降低树的深度，进行剪枝
增大正则项系数。
采用dropout方法，dropout方法，通俗的讲就是在训练的时候让神经元以一定的概率不工作。
early stopping。
减少迭代次数。
增大学习率。
添加噪声数据。
树结构中，可以对树进行剪枝。
减少特征项。
集成学习方法。把多个模型集成到一起，降低单个模型过拟合风险，比如Bagging
欠拟合和过拟合这些方法，需要根据实际问题，实际模型，进行选择。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ML - 解决欠拟合和过拟合

模型欠拟合：在训练集以及测试集上同时具有较高的误差，此时模型的偏差较大；模型过拟合：在训练集上具有较低的误差，在测试集上具有较高的误差，此时模型的方差较大。如何解决欠拟合：添加其他特征项。组合、泛化、相关性、上下文特征、平台特征等特征是特征添加的重要手段，有时候特征项不够会导致模型欠拟合。添加多项式特征。例如将线性模型添加二次项或三次项使模型泛化能力更强。例如，FM（Factorizat...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。