基础算法-正则化L1和L2

1.正则化的引用

        线性模型常用来处理回归和分类任务,为了防止模型处于过拟合状态,需要用L1正则化和L2正则化降低模型的复杂度,很多线性回归模型正则化的文章会提到L1是通过稀疏化参数来降低复杂度,L2是通过减小参数值的大小来降低复杂度 

2. L1正则化和L2正则化的公式

 

 2.1用等高线展示L1,L2几何解释

 

 

图中:

  • 蓝色的一层层的线,代表正则项的等高线,对于L1它是菱形的,对于L2它是圆形的;
  • 绿色的一层层的圆圈,代表原始损失函数的等高线图
  • 黑色的是坐标轴,这里展示的是二维特征的坐标轴。

关键的关键

  1. 蓝色的等高线和绿色的等高线,分别代表了两个优化问题。对原始的损失函数J添加了正则像之后,优化问题就变成了两个子优化问题的博弈。
  2. 当J和正则项之和最小时,上述的博弈取得平衡。而此时平衡点一定是相切点/端点。相切点的具体位置,取决于正则项的惩罚力度,也就是公式里的。每一个平衡点,对应着一个的设置。
  • 可以想象:当惩罚力度大时,蓝色的线希望扯着绿色的线,往靠近坐标轴的方向移动,而惩罚力度小时,绿色的线希望扯着蓝色的线,往远离坐标轴的方向移动

那么就好理解了,我们可以发现:

  • 对于L1正则化,蓝线和绿线的相切点,随着蓝线不断靠近坐标轴,早晚会碰到坐标轴,抵达坐标轴之后,最优点会保持在L1等高线的端点处,依然在坐标轴上,故某个特征的值会变为0。
  • 而L2的相切点则只能无限接近坐标轴,惩罚力度再大,都到不了0。

2.2 用等高线分步L1和L2的几何解释

L1图示

图中展示的都是达到最优的时候的两个等高线的关系。图注都写在图片里了,随着的增大,L1的蓝色的方框不断缩小,拉扯着J的绿色圆圈变大,第三张子图的时候,最优点到达了L1的顶点
后面如果继续增大的话,最优点会沿着纵坐标往下滑。所以,当超过某个阈值的时候,最优解中的w1就会总等于0. 

L2图示

 L2理解起来久简单多了,两个圆一直都是相切的状态,切点永远到不了原点,也就没法让某个特征等于0。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值