L1正则化与L2正则化

α2022

已于 2023-04-13 21:40:41 修改

阅读量74

点赞数

分类专栏： AI基础知识文章标签：机器学习人工智能

于 2023-03-20 22:22:32 首次发布

本文链接：https://blog.csdn.net/weixin_43781113/article/details/129671604

版权

AI基础知识专栏收录该内容

1 篇文章 0 订阅

订阅专栏

目的：解决过拟合现象
过拟合指的是一个机器学习模型在训练集上表现良好，但在测试集上表现较差的现象。这种现象通常是因为模型过于复杂，以至于它能够完美地拟合训练集中的每一个数据点，但是在面对新数据时却无法正确泛化。

L1正则化

$\text { 误差 } J(\theta)=\left[y_\theta(x)-y\right]^2+\left[\left|\theta_1\right|+\left|\theta_2\right| . .\right]$

L2正则化

$\text { 误差 } J(\theta)=\left[y_\theta(x)-y\right]^2+\left[\theta_1^2+\theta_2^2+. . .\right]$

细说

$\text { 误差 } J(\theta)=\left[y_\theta(x)-y\right]^2+\left[\theta_1^2+\theta_2^2+. . .\right]$

机器学习是通过修改 $\theta$ 来减小误差的过程，非线性越强的参数就会修改的越多
对正则化项进行限制，即：
$\left[\left|\theta_1\right|+\left|\theta_2\right| . .\right]<=w$
$\left[\theta_1^2+\theta_2^2+. . .\right]<=w$

降低了 $\theta$ 的大小范围，从而降低了复杂度，所以解决了过拟合
在这里插入图片描述
蓝色圆心是误差最小的地方，圆上的点误差相同，黄色为额外误差（可理解为惩罚度）
蓝色与黄线的交点能够让两个和最小，即 $\theta_1 \theta_2$ 正规化后的解
L1能够保留对结果贡献最大的特征，如图只保留了 $\theta_1$

在这里插入图片描述
对于批数据量，数据的误差曲线发生变化
对于L2中的白点的位置可能不会移动很大，但是在L1中会跳到许多不同的地方，这也反映出L1正则化的解不稳定
通过控制正则化的强度加入 $\lambda$ , 以及用 $p$ 来表示正则化程度
$J(\theta)=\left[y_\theta(x)-y\right]^2+\lambda \sum \theta_i^p$
通过交叉验证选择比较好的 $\lambda$

文章推荐
http://t.csdn.cn/Skij

α2022

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
L1正则化与L2正则化

对于L2中的白点的位置可能不会移动很大，但是在L1中会跳到许多不同的地方，这也反映出L1正则化的解不稳定。蓝色圆心是误差最小的地方，圆上的点误差相同，黄色为额外误差（可理解为惩罚度）来减小误差的过程，非线性越强的参数就会修改的越多。L1能够保留对结果贡献最大的特征，如图只保留了。蓝色与黄线的交点能够让两个和最小，即。对于批数据量，数据的误差曲线发生变化。通过控制正则化的强度加入。通过交叉验证选择比较好的。
复制链接

扫一扫