一.L2正则化
左半部分:经验风险 右半部分:正则化项
右半部分计算如下:
弗罗贝尼乌斯范数:
梯度下降过程:
L2正则化也被称为权重衰减
二.L1正则化
其他同上
三.L1与L2的对比分析
L2正则化的效果是对原最优解的每个元素进行不同比例的放缩, L1正则化则会使原最优解的元素产生不同量的偏移,并使某些元素为0,从而产生稀疏性。
左半部分:经验风险 右半部分:正则化项
右半部分计算如下:
弗罗贝尼乌斯范数:
梯度下降过程:
L2正则化也被称为权重衰减
其他同上
L2正则化的效果是对原最优解的每个元素进行不同比例的放缩, L1正则化则会使原最优解的元素产生不同量的偏移,并使某些元素为0,从而产生稀疏性。