解释:L1正则由模型的参数的绝对值的和构成,L2范数由模型的参数的平方和构成。
L1正则能够有效的
1)降低模型的复杂度
2)做特征选择
这是由于当采用L1正则后模型中对于部分特征的权重会置零。这样可以有效的降低有依赖的特征,起到特征选择的作用,同时特征维度降低后模型的复杂度也随之降低。所以L1正则适用于特征有相互依赖,且对权重是0或者非0相当敏感的模型。
L2正则能降低模型结构风险,防止模型过拟合。
加上L2正则后的损失要求损失函数降低的同时,特征权重也被限制在较小的范围。这样当特征维度较高时候也能保证模型受高次幂的影响较低,是模型能够在经验风险和结构风险之间得以平衡,提高模型的鲁棒性,降低模型的复杂度。所以L2正则适用于特征维度高的模型。
公众号分享机器学习,深度学习知识和技巧,以及学习资料。