9.1 过拟合与L1、L2正则化

最新推荐文章于 2023-12-10 17:30:22 发布

/home/liupc

最新推荐文章于 2023-12-10 17:30:22 发布

阅读量398

点赞数

分类专栏： 11 Python/DL/ML

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pengchengliu/article/details/108926172

版权

一、正则化、偏差-方差分解

二、L2正则项（weight decay）

一、正则化、偏差-方差分解

在机器学习中，我们经常听到Regularization。

正则化是什么意思呢？从字面上很难理解。其实正则化就是减小方差的策略。

什么是方差？方差、偏差、噪声、误差的关系。下面是西瓜书中的定义。

其实还是云里雾里。通过一个例子来看一下：

深红色的曲线是验证机的loss。橙色的曲线是训练集的loss。通常我们希望loss能达到0。

训练集与0之间的差异由噪声和偏差组成。通常我们不会考虑噪声，所以我们就把训练集与真实值的误差认为是偏差，用来刻画模型的拟合能力。

而方差是训练集与验证集之间的差异。在一个数据集上表现这样，换个数据集表现有那样。它是用来刻画数据扰动所造成的影响。

注：一定要结合李宏毅的笔记来复习。

我的理解就是：bias反映模型拟合能力。比如一次函数，二次函数，三次函数拟合能力肯定不一样。模型越复杂，拟合能力越强。同时，模型越复杂，方差会越大。

欠拟合：bias太大，模型拟合能力不够，需要重新设计一个更复杂的模型。

过拟合：variance太大，模型太复杂，需要设计一个简单的模型或者增加数据集或者增加正则项。

这就是高方差。说白了就是过拟合。

二、L1正则项、L2正则项（weight decay）

1. L1和L2正则化介绍

防止过拟合的方法有：1. 增加数据集（数据增强）。 2. dropout 随机失活 3. early stopping 4. 正则化

就是在目标函数后面增加一个正则项。这节课主要来学习L1和L2。

增加了正则项之后，模型输出不仅希望Cost更小，同时也希望权值的绝对值或平方也要小。

如果加上L1、L2，模型会产生什么变化呢？我们经常会看到这两张图。

左边的图

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
9.1 过拟合与L1、L2正则化

一、正则化、偏差-方差分解二、L2正则项（weight decay）一、正则化、偏差-方差分解在机器学习中，我们经常听到Regularization。正则化是什么意思呢？从字面上很难理解。其实正则化就是减小方差的策略。什么是方差？方差、偏差、噪声、误差的关系。下面是西瓜书中的定义。其实还是云里雾里。通过一个例子来看一下：深红色的曲线是验证机的loss。橙色的曲线是训练集的loss。通常我们希望loss能达到0。训练集与0之间的差异由噪声和偏差组成。通常我们..
复制链接

扫一扫

专栏目录

/home/liupc CSDN认证博客专家 CSDN认证企业博客

码龄14年

700: 原创

2万+: 周排名

9488: 总排名

113万+: 访问

: 等级

1万+: 积分

1598: 粉丝

1011: 获赞

222: 评论

3514: 收藏

私信

关注

热门文章

分类专栏

最新评论

图像检索评价指标：mAP@k、mAP的计算
哪里有彩虹告诉我12138: 你这个map居然比map@k的值大
python/ML/DL学习目录
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
使用的数据集
w-blueing: 作者就是第四种数据集可以分享一下吗
总结：nn.Module的children()与modules()方法、如何获取网络的某些层
12-14: 博主这篇文章写得太细节了，举例非常通俗易懂，解决了我的疑问
使用的数据集
CT0501: 数据呢

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。