L1和L2正则化

Le0v1n

于 2021-10-07 14:58:14 发布

阅读量155

点赞数

文章标签：神经网络深度学习

搬的时候标注一下来源，谢谢。

本文链接：https://blog.csdn.net/weixin_44878336/article/details/120635946

版权

正则化的定义

在DL中，凡是能够减少过拟合的方法都叫做“正则化”。

常见的正则化方法（减少过拟合的方法）：

$L_1$ 正则化
$L_2$ 正则化
BN
Dropout
Data Augment
…

$L_1$ 和 $L_2$ 正则化的定义

$L_1$ 就是取绝对值的和
$L_1$ 就是取平方和再开根号

$L_1$ :
$x||_i = |x_1| + |x_2| + ... + |x_n|$

$L_2$ :
$||x||_i = \sqrt{|x_1^2| + |x_2^2| + ... + |x_n^2|}$

$L_1$ 与 $L_2$ 正则化的区别

在这里插入图片描述

$L_2$ 正则化

$L_2$ 正则化就是单纯的将参数 $w_i$ 变小。因为如果 $w_i$ 太大，对于训练来说没啥影响，总会拟合出一个不错的结果。但对于测试就影响很大了。

最简单的例子，在测试阶段，我们输入的图像有噪声，那么过大的 $w_i$ 也会放大噪声，这不利于模型的Inference。

$L_1$ 正则化

$L_1$ 带来了稀疏性。

在这里插入图片描述

举个例子来解释：比如我们想要识别一只猫，对于 $L_2$ 正则化，它就单纯的将 $w_i$ 减小，但是判断是不是一只猫仍然需要两个特征→猫胡子和猫耳朵，这就和我们的之前提到赫布学习理论的道理是一样的，与猫相关的神经元得同时激活，共同评判。

在这里插入图片描述

但对于 $L_1$ 正则化来说，y轴上有两个值，与 $L_2$ 正则化相比， $L_1$ 正则化将猫的两个特征剥离了，不需要两个特征共同配合，这就引入了稀疏性。

Note:

这里的横轴和纵轴是简化的，不只只有这么两条轴，在神经网络中有很多的轴（因为起码得比特征高一维你才可以进行分类）。
不管是使用 $L_1$ 正则化还是 $L_2$ 正则化，都会带来一定的数据偏差，但是这个偏差并没有我们想象中那么大，所以我们可以忽视它。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
L1和L2正则化

正则化的定义在DL中，凡是能够减少过拟合的方法都叫做“正则化”。常见的正则化方法（减少过拟合的方法）：L1L_1L1正则化L2L_2L2正则化BNDropoutData Augment…L1L_1L1和L2L_2L2正则化的定义L1L_1L1就是取绝对值的和L1L_1L1就是取平方和再开根号L1L_1L1:∣∣x∣∣i=∣x1∣+∣x2∣+...+∣xn∣||x||_i = |x_1| + |x_2| + ... + |x_n|∣∣x∣∣i=∣x1
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。