L范数和L2范数是在正则化和特征选择中经常使用的正则化项,它们在度量向量的方式、特点和应用方面有所区别。
L1范数(L1 Norm):
- 定义:L1范数是向量元素的绝对值之和,也称为曼哈顿距离或稀疏范数。对于向量x=(x1, x2, ..., xn),L1范数定义为∥x∥₁ = |x1| + |x2| + ... + |xn|。
- 特点:
- L1范数可以使某些元素变为零,并具有产生稀疏解的能力。因此,在特征选择和稀疏建模中常用L1范数。
- L1范数产生的解通常具有较少的非零系数,可以用于特征选择和过滤掉不相关的特征。
L2范数(L2 Norm):
- 定义:L2范数是向量元素平方的总和的平方根,也称为欧几里德范数。对于向量x=(x1, x2, ..., xn),L2范数定义为∥x∥₂ = √(x1² + x² + ... + xn²)。
- 特点:
- L2范数在优化问题中有可解析的最优解,更易于计算梯度和求解。
- L2范数会惩罚所有非零系数,因此解通常更为平滑。
- L2范数对异常值不敏感,对于处理异常数据有一定的稳定性。
区别:
- 形式:L1范数是绝对值之和,L2范数是平方和再开根号。
- 选择性:L1范数具有产生稀疏解的能力,倾向于将某些特征的系数设为零,而L2范数倾向于使所有特征的系数都尽可能小但非零。
- 平滑性:L1范数的解是一个稀疏的解,L2范数的解更加平滑。
- 稳定性:L2范数对异常值不敏感,而L1范数对异常值敏感。
根据具体问题和需求,我们可以根据L1范数的稀疏特性,选择它来进行特征选择或模型压缩;或者根据L2范数的平滑性和稳定性,在优化问题中采用L2范数进行正则化。