过拟合和欠拟合现象及解决方案

最新推荐文章于 2024-05-08 09:03:03 发布

Chen_Swan

最新推荐文章于 2024-05-08 09:03:03 发布

阅读量3.2k

点赞数 1

分类专栏：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Chen_Swan/article/details/105442248

版权

过拟合和欠拟合

欠拟合：（under-fitting）也称为欠学习，它的直观表现是算法训练得到的模型在训练集上表现差，没有学到数据的规律。引起欠拟合的原因有：模型本身过于简单，例如数据本身是非线性的但使用了线性模型；特征数太少无法正确的建立统计关系。

过拟合：（over-fitting）随着训练过程的进行，模型复杂度，在training data上的error渐渐减小。可是在验证集上的error却反而渐渐增大——由于训练出来的网络过拟合了训练集，对训练集以外的数据却不work。过拟合即在训练误差很小,而泛化误差很大,因为模型可能过于的复杂,使其”记住”了训练样本,然而其泛化误差却很高。

解决过拟合的方法：

1. 加入正则化项，参数范数惩罚，可在优化原来目标函数的同时，避免权值过大带来的过拟合风险

最常用的范数惩罚为L1,L2正则化，L1又被成为Lasso，

Lasso回归的损失函数：

Ridge回归损失函数：

L1正则可以产生稀疏模型（L1是怎么让系数等于零的）。

假设有如下带L1正则化的损失函数：

其中J0是原始的损失函数，加号后面的一项是L1正则化项，α是正则化系数。注意到L1正则化是

最低0.47元/天解锁文章

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
过拟合和欠拟合现象及解决方案

过拟合和欠拟合欠拟合：（under-fitting）也称为欠学习，它的直观表现是算法训练得到的模型在训练集上表现差，没有学到数据的规律。引起欠拟合的原因有：模型本身过于简单，例如数据本身是非线性的但使用了线性模型；特征数太少无法正确的建立统计关系。过拟合：（over-fitting）随着训练过程的进行，模型复杂度，在training data上的error渐渐减小。可是在验证集上的erro...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。