L0/L1/L2/Lp/L∞范数的联系与区别

向量的范数可以简单形象的理解为向量的长度,或者向量到零点的距离,或者相应的两个点之间的距离。

向量的范数定义:向量的范数是一个函数||x||,满足非负性||x|| >= 0,齐次性||cx|| = |c| ||x|| ,三角不等式||x+y|| <= ||x|| + ||y||。

常用的向量的范数:

L0范数:||x||0为x向量各个非零元素的个数。
||x|| 0 =#(i) with x i ≠0 。
也就是如果我们使用L0范数,即希望w的大部分元素都是0. (w是稀疏的)所以可以用于ML中做稀疏编码,特征选择。通过最小化L0范数,来寻找最少最优的稀疏特征项。但不幸的是,L0范数的最优化问题是一个NP hard问题,而且理论上有证明,L1范数是L0范数的最优凸近似,因此通常使用L1范数来代替。

L1范数: ||x||1 为x向量各个元素绝对值之和。
||x|| 1 =∑ |x i |
L1范数的解通常是稀疏性的,倾向于选择数目较少的一些非常大的值或者数目较多的insignificant的小值。

L2范数: ||x||2为x向量各个元素平方和的1/2次方,L2范数又称Euclidean范数(欧氏距离)或者Frobenius范数
L2范数越小,可以使得w的每个元素都很小,接近于0,但与L1范数不同的是他不会让它等于0而是接近于0.
由于L1范数并没有平滑的函数表示,起初L1最优化问题解决起来非常困难,但随着计算机技术的到来,利用很多凸优化算法使得L1最优化成为可能。

Lp范数: ||x||为x向量各个元素绝对值p次方和的1/p次方
L∞范数: ||x||为x向量各个元素绝对值最大那个元素的绝对值

  • 16
    点赞
  • 46
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
L1L2范数标准化是机器学习中常用的正则化方法。L1范数是指权重参数的绝对值之和,而L2范数是指权重参数的平方和的平方根。L1范数L2范数的差别在于它们对权重参数的惩罚方式不同。 L1范数标准化会倾向于产生稀疏的权重矩阵,即将一些权重参数变为0,这有助于特征选择和模型简化。由于L1范数的下降速度比L2范数快,当权重参数接近0时,L1范数可以更快地将其变为0。因此,L1范数标准化可以用作特征选择的方法,去除对模型贡献较小的特征。 相比之下,L2范数标准化会使权重参数更加平滑。由于L2范数的下降速度相对较慢,它更加倾向于将权重参数均匀地分布在不同的特征上,避免过分依赖某个特征。L2范数标准化有助于防止模型过拟合,提高模型的泛化能力。 因此,选择使用L1范数还是L2范数标准化取决于具体的问题和数据集特点。如果希望进行特征选择或模型简化,可以使用L1范数标准化。如果希望平滑权重参数并防止过拟合,可以使用L2范数标准化。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [L1/L2范数](https://blog.csdn.net/qq_29053993/article/details/90900123)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值