机器学习笔记（三）过拟合、欠拟合与正则化

Vic.C

已于 2022-04-13 14:57:00 修改

阅读量953

点赞数

分类专栏：机器学习笔记文章标签：线性代数

于 2022-04-13 14:56:06 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/viccwt/article/details/124120632

版权

本文介绍了机器学习中常见的问题——过拟合和欠拟合，包括它们的定义和产生原因。过拟合通常是由于模型复杂度过高导致泛化能力下降，而欠拟合则可能是因为模型复杂度不足。为了解决过拟合，文章详细探讨了正则化的概念，特别是L1和L2正则化，这两种方法能有效降低模型复杂度并提高泛化能力。

摘要由CSDN通过智能技术生成

一、过拟合与欠拟合

1.定义

过拟合与欠拟合都是机器学习建模过程中可能遇到的问题。欠拟合指模型在训练过程中对训练集拟合效果差，一般是由于模型的复杂度过低；过拟合指模型在训练过程中对训练集拟合效果好，但在测试过程中对测试集拟合效果差，即模型的泛化能力差，一般是由于建立的模型过于复杂。
图中绿线代表正常拟合情况，黄线代表过拟合情况，红线代表欠拟合情况

2.出现原因

出现欠拟合情况的原因一般是模型还未完成学习，在后续的学习过程中一般能够得到改善。

出现过拟合情况的原因一般为：
1.训练集数据类型单一或数据量过小
2.训练数据当中噪声干扰过大
3.模型过于复杂（包含了过多特征）

二、正则化

正则化是解决模型过拟合问题的重要方法。具体做法是在损失函数中加入一个正则项后再求解参数 $\theta$ ，从而降低模型的复杂度，常用的正则项有L1正则项与L2正则项。

$\theta=argmin_\theta[Loss(\theta)+\sum\lambda R(\theta)]=argmin_\theta[\frac{1}{m}\sum_{i=1}^{m}((h_\theta(x_i)-y_i)^2+\lambda R(\theta))]$

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习笔记（三）过拟合、欠拟合与正则化

一、过拟合与欠拟合1.定义过拟合与欠拟合都是机器学习建模过程中可能遇到的问题。欠拟合指模型在训练过程中对训练集拟合效果差，一般是由于模型的复杂度过低；过拟合指模型在训练过程中对训练集拟合效果好，但在测试过程中对测试集拟合效果差，即模型的泛化能力差，一般是由于建立的模型过于复杂。2.出现原因出现欠拟合情况的原因一般是模型还未完成学习，在后续的学习过程中一般能够得到改善。出现过拟合情况的原因一般为：1.训练集数据类型单一或数据量过小2.训练数据当中噪声干扰过大3.模型过于复杂（包含了过多特征）
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。