几何角度理解:L1比L2范数更具有稀疏性的理解

在这里插入图片描述

很多解释L1和L2稀疏性比较的文章都有上面这图。都说:因为L1和h(x)的交点更容易出现在轴上,所以会使得系数取0,获取稀疏的权重。但之前一直不理解,为什么交点就是最小误差的点呢?

这里记录下现在的理解:

error = h(x ) + C * L1
设h(x) = a, L1=b, 它们的等值线分别如下图所示

在这里插入图片描述

假设现在任取一个点w4,w4分别位于 h(w) = a1 和 L1=b1 上,所以当前 error = a1 + b1。从图上可以看到,w2和w4在L1的同一条等值线上,且h(w2)<h(w4) (h(w)的最小值点在椭圆中心),所以当L1(w)的值固定时,显然w2是最优解。(有些时候h(w)和L1(w)的切点也会在w4这,这时,w4就是最优解了,不过这种情况比较少见)。这就解释了为什么交点容易产生在轴上。
对于w1,w2,w3的比较,从图上可以看出h(w)和L1(w)时互相冲突,h(w)增大,则L1(w)减少,反之亦然。(当h(w)的最小值点在L1(w)的方框内时,两者同时增大,缩小,不过因为要求min error,L1(w)的框会很快缩小,同时减少L1和h的值,直到h的最小值点不在L1的框内)。至于w1,w2,w3哪个更好,就要看C的值了。error = h(w) + C * L1(w),通过C判断h(w) 和 L1(w)哪个更重要。
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值