向量和矩阵的各种范数比较（1范数、2范数、无穷范数等等）

最新推荐文章于 2024-05-13 12:52:03 发布

h_l_dou

最新推荐文章于 2024-05-13 12:52:03 发布

阅读量5.4w

点赞数 20

分类专栏：数学知识文章标签：数学知识

数学知识专栏收录该内容

25 篇文章 2 订阅

订阅专栏

原文：https://blog.csdn.net/Michael__Corleone/article/details/75213123
在刚入门机器学习中的低秩，稀疏模型时，被各种范数搅得一团糟，严重延缓了学习进度，经过一段时间的学习，现在将其完整的总结一下，希望遇到同样麻烦的同学能有所帮助。。。

一、向量的范数

首先定义一个向量为：a=[-5，6，8, -10]

1.1 向量的1范数

向量的1范数即：向量的各个元素的绝对值之和，上述向量a的1范数结果就是：29，MATLAB代码实现为：norm（a，1）；

1.2 向量的2范数

向量的2范数即：向量的每个元素的平方和再开平方根，上述a的2范数结果就是：15，MATLAB代码实现为：norm（a，2）；

1.3 向量的无穷范数

1.向量的负无穷范数即：向量的所有元素的绝对值中最小的：上述向量a的负无穷范数结果就是：5，MATLAB代码实现为：norm（a，-inf）；
2..向量的正无穷范数即：向量的所有元素的绝对值中最大的：上述向量a的负无穷范数结果就是：10，MATLAB代码实现为：norm（a，inf）；

二、矩阵的范数

首先我们将介绍数学中矩阵的范数的情况，也就是无论哪个学科都统一的一种规定。。。
例如矩阵A = [ -1 2 -3；
4 -6 6]

2.1 矩阵的1范数

矩阵的1范数即：矩阵的每一列上的元素绝对值先求和，再从中取个最大的，（列和最大），上述矩阵A的1范数先得到[5,8,9]，再取最大的最终结果就是：9，MATLAB代码实现为：norm（A，1）；

2.2 矩阵的2范数

矩阵的2范数即：矩阵ATA的最大特征值开平方根，上述矩阵A的2范数得到的最终结果是：10.0623，MATLAB代码实现为：norm（A，2）；

2.3 矩阵的无穷范数

矩阵的1范数即：矩阵的每一行上的元素绝对值先求和，再从中取个最大的，（行和最大），上述矩阵A的1范数先得到[6；16]，再取最大的最终结果就是：16，MATLAB代码实现为：norm（A，inf）；

接下来我们要介绍机器学习的低秩，稀疏等一些地方用到的范数，一般有核范数，L0范数，L1范数（有时很多人也叫1范数，这就让初学者很容易混淆），L21范数（有时也叫2范数），F范数。。。上述范数都是为了解决实际问题中的困难而提出的新的范数定义，不同于前面的矩阵范数。

2.4 矩阵的核范数

矩阵的核范数即：矩阵的奇异值（矩阵的q个非负特征值的算数平方根）（将矩阵svd分解）之和，这个范数可以用来低秩表示（因为最小化核范数，相当于最小化矩阵的秩——低秩），上述矩阵A最终结果就是：10.9287， MATLAB代码实现为：sum(svd(A))

2.5 矩阵的L0范数

矩阵的L0范数即：矩阵的非0元素的个数，通常用它来表示稀疏，L0范数越小0元素越多，也就越稀疏，上述矩阵A最终结果就是：6

2.6 矩阵的L1范数

矩阵的L1范数即：矩阵中的每个元素绝对值之和，它是L0范数的最优凸近似，因此它也可以表示稀疏，上述矩阵A最终结果就是：22，MATLAB代码实现为：sum(sum(abs(A)))

2.7 矩阵的F范数

矩阵的F范数即：矩阵的各个元素平方之和再开平方根，它通常也叫做矩阵的L2范数，它的有点在它是一个凸函数，可以求导求解，易于计算，上述矩阵A最终结果就是：10.0995，MATLAB代码实现为：norm（A，‘fro’）

2.8 矩阵的L21范数

矩阵的L21范数即：矩阵先以每一列为单位，求每一列的F范数（也可认为是向量的2范数），然后再将得到的结果求L1范数（也可认为是向量的1范数），很容易看出它是介于L1和L2之间的一种范数，上述矩阵A最终结果就是：17.1559，MATLAB代码实现为： norm(A(:,1),2) + norm(A(:,2),2) + norm(A(:,3),2)

下文来自 yangpan011 的CSDN 博客，全文地址请点击：https://blog.csdn.net/yangpan011/article/details/79461846?utm_source=copy

0范数，向量中非零素的个数。

1范数，为绝对值之和。

2范数，就是通常意义上的模。

无穷范数，就是取向量的最大值。
在这里插入图片描述

具体怎么用，看不同的领域，看你来自计算机领域用的比较多的就是迭代过程中收敛性质的判断，如果理解上述的意义，在计算机领域，一般迭代前后步骤的差值的范数表示其大小，常用的是二范数，差值越小表示越逼近实际值，可以认为达到要求的精度，收敛。
总的来说，范数的本质是距离，存在的意义是为了实现比较。比如，在一维实数集合中，我们随便取两个点4和9，我们知道9比4大，但是到了二维实数空间中，取两个点（1，1）和（0，3），这个时候我们就没办法比较它们之间的大小，因为它们不是可以比较的实数，于是我们引入范数这个概念，把我们的（1，1）和（0，3）通过范数分别映射到实数和 3 ，这样我们就比较这两个点了。所以你可以看到，范数它其实是一个函数，它把不能比较的向量转换成可以比较的实数。
在上面的例子里，我们用的范数是平方求和然后再开方，范数还有很多其他的类型，这个就要看具体的定义了，理论上我们也可以把范数定义为只比较x轴上数字的绝对值。
PS：我这里说的是向量范数。?
什么一范数二范数也是用来度量一个整体，比如两个个班的人比较高度，你可以用班里面最高的人（无穷范数）去比较，也可以用班里所有人的身高总和比较（一范数），也可以求平均（几何平均？忘记了。。）（类似二范数）。
举一个简单的例子，一个二维度的欧氏几何空间 R ^2就有欧氏范数。在这个向量空间的元素（譬如：(3,7)）常常在笛卡儿坐标系统被画成一个从原点出发的箭号。每一个向量的欧氏范数就是箭号的长度。

h_l_dou

关注

20
点赞
踩
124

收藏

觉得还不错? 一键收藏
1
评论
向量和矩阵的各种范数比较（1范数、2范数、无穷范数等等）

0范数，向量中非零元素的个数。1范数，为绝对值之和。2范数，就是通常意义上的模。无穷范数，就是取向量的最大值。具体怎么用，看不同的领域，看你来自计算机领域用的比较多的就是迭代过程中收敛性质的判断，如果理解上述的意义，在计算机领域，一般迭代前后步骤的差值的范数表示其大小，常用的是二范数，差值越小表示越逼近实际值，可以认为达到要求的精度，收敛。总的来说，范数的本质是距离，存在的意义是为...
复制链接

扫一扫