L1正则化可以产生稀疏权值矩阵,即产生一个稀疏模型,可以用于特征选择
L2正则化可以防止模型过拟合(overfitting);一定程度上,L1也可以防止过拟合
L1不可导:
第二境界:知道上面的proximal mamping的如何推导出结论的分段函数
介绍一下上面的prox映射
proximal映射是关于函数h的一个映射
第三境界:知道proximal mapping在这里代表什么,知道如何从目标函数展开泰勒公式,从而得到proximal mapping。(以下引用自西瓜书)
参考链接:
https://www.zhihu.com/question/38426074
https://blog.csdn.net/jinping_shi/article/details/52433975