过拟合问题相关概念

最新推荐文章于 2021-03-12 14:17:57 发布

cugzyc

最新推荐文章于 2021-03-12 14:17:57 发布

阅读量203

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41333844/article/details/97242723

版权

机器学习专栏收录该内容

17 篇文章 1 订阅

订阅专栏

根据数据集在当前模型参数下的情况判断参数拟合情况

训练集与验证集不同表现与拟合情况

从图中我们能够看出，模型在训练集上表现很好，但是在交叉验证集上表现先好后差。表明出现了过拟合。

正则化、k折交叉验证，防止过拟合，提高模型的泛化能力。

发生过拟合的主要原因可以有以下三点：

（1）数据有噪声

（2）训练数据不足，有限的训练数据

（3）训练模型过度导致模型非常复杂

解决过拟合的方法

1、避免过拟合的方式之一是使用交叉验证（cross validation），这有利于估计测试集中的错误，同时有利于确定对模型最有效的参数。一边用训练集对模型进行训练，一边观察当前的参数在验证集上的表现，当效果开始变差（误差变大）时，说明即将出现了过拟合，此时停止训练。

2、正则化，包括L1正则化、L2正则化等

正则化是一种回归的形式，它将系数估计（coefficient estimate）朝零的方向进行约束、调整或缩小。也就是说，正则化可以在学习过程中降低模型复杂度和不稳定程度，从而避免过拟合的危险。

参数复杂容易过拟合，添加参数的惩罚项，比如L1范数、L2范数、L1-L2共同使用

3、增大训练集

机器学习中正则化项L1和L2的直观理解https://blog.csdn.net/jinping_shi/article/details/52433975

【机器学习】正则化项L1和L2的直观理解https://www.jianshu.com/p/aa3b82417db2

机器学习之正则化（Regularization）

欠拟合和过拟合出现原因及解决方案

怎么解决过拟合与欠拟合https://blog.csdn.net/u010899985/article/details/79471909

解决过拟合方法https://zhuanlan.zhihu.com/p/42070435

正则化技术

https://pan.baidu.com/s/1KdeKQEojZXmvfdGaWvGZFg?errno=0&errmsg=Auth%20Login%20Sucess&&bduss=&ssnerror=0&traceid=#list/path=%2Fsharelink1663600092-640860342866938%2F%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%AE%9E%E6%88%98%E7%AC%AC%E5%85%AB%E8%AE%B2-%E6%AD%A3%E5%88%99%E5%8C%96%E6%8A%80%E6%9C%AF(%E9%99%84%E5%8A%A0%E5%86%85%E5%AE%B9)&parentPath=%2Fsharelink1663600092-640860342866938

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
过拟合问题相关概念

根据数据集在当前模型参数下的情况判断参数拟合情况训练集与验证集不同表现与拟合情况从图中我们能够看出，模型在训练集上表现很好，但是在交叉验证集上表现先好后差。表明出现了过拟合。正则化、k折交叉验证，防止过拟合，提高模型的泛化能力。发生过拟合的主要原因可以有以下三点：（1）数据有噪声（2）训练数据不足，有限的训练数据（3）训练模型过度导致模型非常复杂解决过拟合...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。