L1正则和L2正则对网络参数的影响

最新推荐文章于 2022-03-05 14:27:52 发布

king的江鸟

最新推荐文章于 2022-03-05 14:27:52 发布

阅读量527

点赞数 1

分类专栏：深度学习人工智能正则化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40939578/article/details/103865585

版权

人工智能同时被 3 个专栏收录

18 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

一、正则化的来源

在深度网络的训练中，参数如果没有一个”正则化”的限制，很可能会导致过拟合（容易过大或过小），因此在制定损失函数时，往往加入对参数的约束，这就是正则化，通常的正则化有L1正则，L2正则或者两者的搭配权重使用。无论是L1还是L2正则，都有着把参数量变小的效果，但是L1正则由于函数图像的特殊性，导致了一种稀疏化的特性，便于选择特征。

二、L1正则的稀疏化选择特性

我们知道，L1正则将绝对值函数作为正则化的约束，那么如图所示：

加入了L1正则的损失函数定义为 $\delta =f(x)_{loss}+\left \| W \right \|_{1}$ ，将损失函数看成两个部分，想要同时减少两个部分，考虑极限情况，这两个属于互相对抗的损失，在某个点一定可以找到两者的平衡点，由于L1正则函数的尖锐，并且所有尖锐点处于坐标轴上，因此有更大的概率形成稀疏化。

反观L2就很可能在其他点找到平衡，最后造成都是一些很小的但是不会变成0的参数。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
L1正则和L2正则对网络参数的影响

一、正则化的来源在深度网络的训练中，参数如果没有一个”正则化”的限制，很可能会导致过拟合（容易过大或过小），因此在制定损失函数时，往往加入对参数的约束，这就是正则化，通常的正则化有L1正则，L2正则或者两者的搭配权重使用。无论是L1还是L2正则，都有着把参数量变小的效果，但是L1正则由于函数图像的特殊性，导致了一种稀疏化的特性，便于选择特征。二、L1正则的稀疏化选择特...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。