一点点查漏补缺吧~
l1范数为什么比l2范数更容易得到稀疏解
其实这个问题我之前看到过,包括也有介绍过0,1,2范数(详见L0、L1、L2、核范数以及RPCA方法的应用),但是面试的时候却又结结巴巴地回答不上来,归根到底还是理解得不够透彻,现在又重新来梳理一遍。
参看了一下知乎上的l1相比于l2为什么容易获得稀疏解的相关答案后,才知道原来这个问题有三种理解,此处就偷个懒转个图了。
这里对于"优化角度"的那个PRML上的图进行补充说明,那就是图中黄色的部分表示的其实是
w
w
w的一个等值曲线,而圆圈代表的是w的一个可行解: