L1和L2的区别

L范数和L2范数是在正则化和特征选择中经常使用的正则化项,它们在度量向量的方式、特点和应用方面有所区别。

L1范数(L1 Norm):

- 定义:L1范数是向量元素的绝对值之和,也称为曼哈顿距离或稀疏范数。对于向量x=(x1, x2, ..., xn),L1范数定义为∥x∥₁ = |x1| + |x2| + ... + |xn|。

- 特点:

  - L1范数可以使某些元素变为零,并具有产生稀疏解的能力。因此,在特征选择和稀疏建模中常用L1范数。

  - L1范数产生的解通常具有较少的非零系数,可以用于特征选择和过滤掉不相关的特征。

L2范数(L2 Norm):

- 定义:L2范数是向量元素平方的总和的平方根,也称为欧几里德范数。对于向量x=(x1, x2, ..., xn),L2范数定义为∥x∥₂ = √(x1² + x² + ... + xn²)。

- 特点:

  - L2范数在优化问题中有可解析的最优解,更易于计算梯度和求解。

  - L2范数会惩罚所有非零系数,因此解通常更为平滑。

  - L2范数对异常值不敏感,对于处理异常数据有一定的稳定性。

区别:

- 形式:L1范数是绝对值之和,L2范数是平方和再开根号。

- 选择性:L1范数具有产生稀疏解的能力,倾向于将某些特征的系数设为零,而L2范数倾向于使所有特征的系数都尽可能小但非零。

- 平滑性:L1范数的解是一个稀疏的解,L2范数的解更加平滑。

- 稳定性:L2范数对异常值不敏感,而L1范数对异常值敏感。

根据具体问题和需求,我们可以根据L1范数的稀疏特性,选择它来进行特征选择或模型压缩;或者根据L2范数的平滑性和稳定性,在优化问题中采用L2范数进行正则化。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值