机器学习知识总结——过拟合和欠拟合

小夏refresh

已于 2024-06-17 10:46:50 修改

阅读量1.4k

点赞数

分类专栏：机器学习数据挖掘文章标签：过拟合欠拟合机器学习深度学习正则化

于 2021-01-26 09:09:27 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c2861024198/article/details/113172767

版权

机器学习同时被 2 个专栏收录

14 篇文章 2 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

过拟合（overfitting）

什么是过拟合？

所谓过拟合就是指在验证集和训练集上表现很好，但是在测试集上表现很差，也就是说泛化能力差。一般表现为: 高方差，低偏差

过拟合的原因

训练样本选取有误、样本标签错误等
样本噪声干扰过大
模型过于复杂
对于神经网络来说:
- 学习迭代次数太多

如何防止/解决过拟合问题？

扩大数据集
进行正则化(L1正则或者L2正则等)
采用合适的模型(控制模型的复杂度)
Early stopping(通过迭代次数截断的方法来防止过拟合)
Dropout(在神经网络中可以使用Dropout)
减少特征维度

欠拟合(underfitting)

什么是欠拟合？

欠拟合是指模型在训练集、验证集和测试集上表现都不好

欠拟合的原因是什么

模型复杂度低
模型训练迭代次数太少

如何解决欠拟合问题？

增加迭代次数
增加模型复杂程度
增加特征

正则化

L1正则化

在原始的损失函数后面加一个L1正则化项，即全部权重 $\omega$ 的绝对值的和，在乘以 $\lambda/n$
$C=C_0+\frac\lambda n\sum_i|\omega_i|$
对应梯度
$\frac{\partial C}{\partial\omega}=\frac{\partial C_0}{\partial\omega}+\frac\lambda nsgn(\omega)$
其中 $sgn(\omega)$ 知识简单地取 $\omega$ 各个元素地正负号
$sgn(\omega)= \begin{cases} 1,&\omega>0\\ 0,&\omega=0\\ -1,&\omega<0 \end{cases}$

L2正则化

L2正则化通常被称为权重衰减(weight decay)，就是在原始的损失函数后面再加上一个L2正则化项，即全部权重 $\omega$ 的平方和，在乘以 $\lambda/2n$ 。
$C=C_0+\frac\lambda{2n}\sum_i{\omega^2_i}$
对应梯度
$\frac{\partial C}{\partial\omega}=\frac{\partial C_0}{\partial\omega}+\frac\lambda n\omega$

如有错误，欢迎指正。谢谢

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
机器学习知识总结——过拟合和欠拟合

过拟合（overfitting）什么是过拟合？所谓过拟合就是指在验证集和训练集上表现很好，但是在测试集上表现很差，也就是说泛化能力差。一般表现为: 高方差，低偏差过拟合的原因训练样本选取有误、样本标签错误等样本噪声干扰过大模型过于复杂对于神经网络来说:学习迭代次数太多如何防止/解决过拟合问题？扩大数据集进行正则化(L1正则或者L2正则等)采用合适的模型(控制模型的复杂度)Early stopping(通过迭代次数截断的方法来防止过拟合)Dropout(在神经网络中可以
复制链接

扫一扫

专栏目录

小夏refresh CSDN认证博客专家 CSDN认证企业博客

码龄6年

31: 原创

1万+: 周排名

2万+: 总排名

10万+: 访问

: 等级

991: 积分

99: 粉丝

161: 获赞

36: 评论

424: 收藏

私信

关注

热门文章

分类专栏

深度学习 6篇
论文 5篇
工具 2篇
wsl2 1篇
数据挖掘 4篇
机器学习 14篇
语义分割 1篇
linux 1篇
推荐算法 1篇
数据分析 1篇
Python 3篇
最大似然估计 1篇
极大似然估计 1篇
编程语言 1篇
markdown 1篇
爬虫 1篇
C语言 5篇
数据结构 5篇

最新评论

VMamba: Visual State Space Model论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Mamba: Linear-Time Sequence Modeling with Selective State Spaces论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Harnessing Vision Foundation Models for Domain Generalized Semantic Segmentation
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
逻辑回归(Logistic Regression)详解
CSDN-Ada助手: 如何在逻辑回归模型中引入正则化？
如何通俗理解逻辑回归(Logistic Regression)
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加条理清晰的目录。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小夏refresh 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。