（《机器学习》完整版系列）附录 ——7、有趣的距离与范数（距离是两点之间的，如果将一个点固定在原点，则为向量的范数）

人工干智能

已于 2023-03-31 11:28:54 修改

阅读量249

点赞数

分类专栏：周志华【西瓜书】辅导《机器学习》文章标签：机器学习算法聚类

于 2023-03-02 09:07:14 首次发布

本文链接：https://blog.csdn.net/qiy_icbc/article/details/129293506

版权

周志华【西瓜书】辅导同时被 2 个专栏收录

143 篇文章 29 订阅

订阅专栏

《机器学习》

143 篇文章 5 订阅

订阅专栏

文章详细探讨了聚类中使用的距离概念，包括度量距离和非度量距离，重点分析了闵可夫斯基距离的性质，证明了当p>=1时满足直递性，而当0<p<1时不满足。此外，介绍了豪斯多夫距离及其满足的距离性质，证明了其直递性。文章还提到了向量的范数，如L_p范数，特别是L_2范数（欧几里得范数）和L_0范数（非零分量个数）。

摘要由CSDN通过智能技术生成

聚类的相似度通常用距离来刻划，距离又分为“（度量）距离”和“非度量距离”，“度量距离”由四条基本性质而“非度量距离”少满足一条（即不满足直递性）。
距离是两点之间的（公式中含有这两点的坐标），如果我们将一个点固定在原点，则相应公式就变为只含一个点（向量）了，称为向量的范数。

有趣的距离与范数

距离

聚类的相似度通常用距离来刻划，距离又分为“（度量）距离”和“非度量距离”，“度量距离”由四条基本性质（【西瓜书式(9.14) $\,\thicksim$ (9.17)】定义的“四性”）来刻画，而“非度量距离”少满足一条（即不满足直递性），如，【西瓜书图9.1】示例。

欧氏距离是我们所熟悉的，将其推广到任意正数的闵可夫斯基距离：

（i）p $p\geqslant 1$ ，即【西瓜书式(9.18) $\,\thicksim$ (9.20)】，是度量距离

（ii） $0 < p < 1$ ，是非度量距离

下面我们证明闵可夫斯基距离满足相关性质要求：

（1）不管 $0 < p < 1$ 还是 $p\geqslant 1$ ，显然满足非负性、同一性和对称性。

（2） $p\geqslant 1$ 时满足直递性

证明中涉及到闵可夫斯基不等式:
$\begin{align} \left[\sum_{u=1}^n(a_u+b_u)^p\right]^{\frac{1}{p}}\leqslant \left[\sum_{u=1}^na_u^p\right]^{\frac{1}{p}}+\left[\sum_{u=1}^nb_u^p\right]^{\frac{1}{p}} \tag{C1} \end{align}$
其中， $a_u>0,b_u>0,p\geqslant 1$ 。

该不等式的证明需要用到较难的数学知识，在网上易查到它的证明，这里仅作引用。
$\begin{align} |x_{iu}-x_{ju}| & =|x_{iu}-x_{ku}+x_{ku}-x_{ju}|\notag \\ & \leqslant |x_{iu}-x_{ku}|+|x_{ku}-x_{ju}|\notag \\ |x_{iu}-x_{ju}|^p & \leqslant( |x_{iu}-x_{ku}|+|x_{ku}-x_{ju}|)^p\notag \\ \sum_{u=1}^n|x_{iu}-x_{ju}|^p & \leqslant\sum_{u=1}^n( |x_{iu}-x_{ku}|+|x_{ku}-x_{ju}|)^p\notag \\ \left[\sum_{u=1}^n|x_{iu}-x_{ju}|^p \right]^{\frac{1}{p}} & \leqslant \left[\sum_{u=1}^n( |x_{iu}-x_{ku}|+|x_{ku}-x_{ju}|)^p\right]^{\frac{1}{p}} \tag{C2} \end{align}$

当 $p\geqslant 1$ 时，设 $a_u=|x_{iu}-x_{ku}|,b_u=|x_{ku}-x_{ju}|$ ，对式(C2)右侧应用式(C1)，即得直递性。

（3）当 $0 < p < 1$ 时，直递性不成立

令 $x_{iu}'=x_{iu}-x_{ku},\,x_{ju}'=x_{ju}-x_{ku},$ 直递性等价于：
$\begin{align} \left[\sum_{u=1}^n|x_{iu}'-x_{ju}'|^p \right]^{\frac{1}{p}} & \leqslant \left[\sum_{u=1}^n|x_{iu}'|^p\right]^{\frac{1}{p}}+ \left[\sum_{u=1}^n|x_{ju}'|^p\right]^{\frac{1}{p}} \tag{C3} \end{align}$
由于当 $0 < p < 1$ 时，闵可夫斯基不等式(C1)不成立，即一定存在与 $p$ 相关的 $\boldsymbol{a}_p=(a'_1,a'_2,\cdots,a'_n),\, \boldsymbol{b}_p=(b'_1,b'_2,\cdots,b'_n),\, a'_u>0,b'_u>0$ 使不等式(C1)不成立，即
$\begin{align} \left[\sum_{u=1}^n(a'_u+b'_u)^p\right]^{\frac{1}{p}} > \left[\sum_{u=1}^n(a'_u)^p\right]^{\frac{1}{p}}+\left[\sum_{u=1}^n(b'_u)^p\right]^{\frac{1}{p}} \tag{C4} \end{align}$
令 $x_{iu}'=a'_u,\, x_{ju}'=-b'_u$
$\begin{align} \left[\sum_{u=1}^n|x_{iu}'-x_{ju}'|^p\right]^{\frac{1}{p}} > \left[\sum_{u=1}^n|x_{iu}'|^p\right]^{\frac{1}{p}}+\left[\sum_{u=1}^n|-x_{ju}'|^p\right]^{\frac{1}{p}} \tag{C5} \end{align}$
比较不等式(C5)与不等式(C3)知，当 $0 < p < 1$ 时，直递性不成立。

由（1）（2）（3）即得结论。

有了“点间的距离”，即可用“点间的距离”定义“集合间的距离”，如图C.1所示。
C.1 集合间距离

$(a)$ 点 $\boldsymbol{x}$ 到集合 $Z$ 的距离
$\mathrm{dist}(\boldsymbol{x},Z)=\mathop{\min}\limits_{\boldsymbol{z}}||\boldsymbol{x}-\boldsymbol{z}||_2$
$(b)$ 集合 $X$ 到集合 $Z$ 的距离（最小距离），【西瓜书式(9.41)】定义
$\mathrm{dist}_{\min}(X,Z)=\mathop{\min}\limits_{\boldsymbol{x}}\mathrm{dist}(\boldsymbol{x},Z)=\mathop{\min}\limits_{\boldsymbol{x},\boldsymbol{z}}||\boldsymbol{x}-\boldsymbol{z}||_2$
$(c)$ 集合 $X$ 到集合 $Z$ 的距离（最大距离），【西瓜书式(9.42)】定义
$\mathrm{dist}_{\max}(X,Z)=\mathop{\max}\limits_{\boldsymbol{x}}\mathrm{dist}(\boldsymbol{x},Z)=\mathop{\max}\limits_{\boldsymbol{x}}\mathop{\min}\limits_{\boldsymbol{z}}||\boldsymbol{x}-\boldsymbol{z}||_2$
还可以定义平均距离【西瓜书式(9.43)】 $\mathrm{dist}_{\mathrm{avg}}(X,Z)$ ；
$(d)$ ]集合 $X$ 到集合 $Z$ 的“有向距离” $\mathrm{dist_h}(X,Z)=\mathop{\max}\limits_{\boldsymbol{x}}\mathop{\min}\limits_{\boldsymbol{z}}||\boldsymbol{x}-\boldsymbol{z}||_2$
$(e)$ ]集合 $X$ 到集合 $Z$ 的豪斯多夫距离（两“有向距离”中最大者）
$\begin{align} \mathrm{dist_H}(X,Z)=\max(\mathrm{dist_h}(X,Z),\mathrm{dist_h}(Z,X)) \tag{C6} \end{align}$

下面我们证明豪斯多夫距离满足距离的“四性”要求：

非负性、对称性和同一性显然成立，关键是证直递性。

由欧氏距离性质有
$\begin{align} ||\boldsymbol{x}-\boldsymbol{z}||\leqslant ||\boldsymbol{x}-\boldsymbol{y}||+||\boldsymbol{y}-\boldsymbol{z}|| \tag{C7} \end{align}$
对于给定的 $\boldsymbol{x}$ ，取 $\boldsymbol{y}'=\mathop{\arg\min}\limits_{\boldsymbol{y}}||\boldsymbol{x}-\boldsymbol{y}||$ ，则有
$\begin{align} ||\boldsymbol{x}-\boldsymbol{z}|| & \leqslant ||\boldsymbol{x}-\boldsymbol{y}'||+||\boldsymbol{y}'-\boldsymbol{z}||\notag \\ & =\mathop{\min}\limits_{\boldsymbol{y}}||\boldsymbol{x}-\boldsymbol{y}||+||\boldsymbol{y}'-\boldsymbol{z}|| \tag{C8} \end{align}$
两边取 $\mathop{\min}\limits_{\boldsymbol{z}}$ ，则有
$\begin{align} \mathop{\min}\limits_{\boldsymbol{z}}||\boldsymbol{x}-\boldsymbol{z}|| & \leqslant \mathop{\min}\limits_{\boldsymbol{z}}[\mathop{\min}\limits_{\boldsymbol{y}}||\boldsymbol{x}-\boldsymbol{y}||+||\boldsymbol{y}'-\boldsymbol{z}||]\notag \\ & =\mathop{\min}\limits_{\boldsymbol{y}}||\boldsymbol{x}-\boldsymbol{y}||+\mathop{\min}\limits_{\boldsymbol{z}}||\boldsymbol{y}'-\boldsymbol{z}||\quad \text{（由式(01)）} \tag{C9} \end{align}$
其中，利用数学常识：
$\begin{align} \min( a(x)+ b) & = \min a(x)+b \tag{01} \\ \min(a(x)+b(x)) & \geqslant \min(a(x)+\min b(x))\notag \\ & = \min a(x)+\min b(x)\quad \text{（由式(01)）} \tag{02} \\ \max( a(x)+ b) & = \max a(x)+b \tag{03} \\ \max(a(x)+b(x)) & \leqslant \max(a(x)+\max b(x))\notag \\ & = \max a(x)+\max b(x)\quad \text{（由式(03)）} \tag{04} \end{align}$

对式(C9)两边取 $\mathop{\max}\limits_{\boldsymbol{x}}$ （其中 $\boldsymbol{y}'$ 是 $\boldsymbol{x}$ 的函数），则有
$\begin{align} &\quad \mathop{\max}\limits_{\boldsymbol{x}}\mathop{\min}\limits_{\boldsymbol{z}}||\boldsymbol{x}-\boldsymbol{z}||\notag\\ & \leqslant \mathop{\max}\limits_{\boldsymbol{x}}\mathop{\min}\limits_{\boldsymbol{y}}||\boldsymbol{x}-\boldsymbol{y}||+\mathop{\max}\limits_{\boldsymbol{x}}\mathop{\min}\limits_{\boldsymbol{z}}||\boldsymbol{y}'-\boldsymbol{z}||\quad \text{（由式(04)）}\notag \\ & = \mathop{\max}\limits_{\boldsymbol{x}}\mathop{\min}\limits_{\boldsymbol{y}}||\boldsymbol{x}-\boldsymbol{y}||+\mathop{\max}\limits_{\boldsymbol{y}'}\mathop{\min}\limits_{\boldsymbol{z}}||\boldsymbol{y}'-\boldsymbol{z}||\quad \text{（下式因$\{\boldsymbol{y}'\}\subset \{\boldsymbol{y}\}$）}\notag \\ & \leqslant \mathop{\max}\limits_{\boldsymbol{x}}\mathop{\min}\limits_{\boldsymbol{y}}||\boldsymbol{x}-\boldsymbol{y}||+\mathop{\max}\limits_{\boldsymbol{y}}\mathop{\min}\limits_{\boldsymbol{z}}||\boldsymbol{y}'-\boldsymbol{z}||\quad \tag{C10} \end{align}$

由 $\mathrm{dist_h}$ 的定义，式(C10)即得 $\mathrm{dist_h}$ 的直递性：
$\begin{align} \mathrm{dist_h}(X,Z)\leqslant \mathrm{dist_h}(X,Y)+\mathrm{dist_h}(Y,Z) \tag{C11} \end{align}$
故有
$\begin{align} \begin{cases} \mathrm{dist_h}(X,Y)+\mathrm{dist_h}(Y,Z)\geqslant\mathrm{dist_h}(X,Z) \\ \mathrm{dist_h}(Z,Y)+\mathrm{dist_h}(Y,X)\geqslant \mathrm{dist_h}(Z,X) \\ \end{cases} \tag{C12} \end{align}$

对于两数的 $\max$ 有
$\begin{align} \max(a,b) & =\frac{a+b}{2}+\frac{|a-b|}{2}\tag{C13} \end{align}$
又 $|a+a'-b-b'|\leqslant |a-b|+|a'-b'|$ ，由式(C13)有
$\begin{align} \max(a+a',b+b') & =\frac{a+b+a'+b'}{2}+\frac{|a+a'-b-b'|}{2}\notag \\ & \leqslant \frac{a+b+a'+b'}{2}+\frac{|a-b|+|a'-b'|}{2}\notag \\ & = \frac{a+b}{2}+\frac{|a-b|}{2}+\frac{a'+b'}{2}+\frac{|a'-b'|}{2}\notag \\ & =\max(a,b)+\max(a',b') \tag{C14} \end{align}$
注：通过数学归纳法，该式(C14)易推广到两组数（ $n$ 对）的情形。

又由该距离的定义，有
$\begin{align} & \mathrm{dist_H}(X,Y)+\mathrm{dist_H}(Y,Z)\notag \\ & \ =[\max(\mathrm{dist_h}(X,Y),\mathrm{dist_h}(Y,X))]+[\max(\mathrm{dist_h}(Y,Z),\mathrm{dist_h}(Z,Y))] \tag{C15} \end{align}$
将式(C15)右侧的四个 $\mathrm{dist_h}$ 依次视为 $a, b, a^{'}, b^{'}$ ，则由式(C14)、式(C12)有
$\begin{align} \text{式(C15)右边} & \geqslant \max(\mathrm{dist_h}(X,Y)+\mathrm{dist_h}(Y,Z),\mathrm{dist_h}(Z,Y)+\mathrm{dist_h}(Y,X))\notag \\ & \geqslant \max(\mathrm{dist_h}(X,Z),\mathrm{dist_h}(Z,X))\notag \\ & =\mathrm{dist_H}(X,Z) \tag{C16} \end{align}$
连接式(C15)与式(C16)即为豪斯多夫距离的直递性。

上述关于闵可夫斯基距离和豪斯多夫距离的直递性证明是不是很有技巧性和趣味性？

对于无序属性以及有序与无序混合分别定义了距离【西瓜书式(9.21)】和【西瓜书式(9.22)】，还可以考虑对不同属性的重要性进行加权【西瓜书式(9.23)】。

范数

距离是两点之间的（公式中含有这两点的坐标），如果我们将一个点固定在原点，则相应公式就变为只含一个点（向量）了，称为向量的范数。 $n$ 维向量 $\boldsymbol{x}=(x_1;x_2;\cdots ;x_u;\cdots ;x_n)$ 的常用范数
$\begin{align} & \text{$L_p$：}{\| \boldsymbol{x} \|}_p = \left( (\sum_{u=1}^n|x_u|^p) \right)^{\frac{1}{p}}\tag{C17} \\ \text{特别地：} & \notag \\ & \text{$L_2$：}\| \boldsymbol{x} \|_2 =\sqrt{\left(\sum_{u=1}^n|x_u|^2\right)} \tag{C18} \\ & \text{$L_1$：}\| \boldsymbol{x} \|_1 =\sum_{u=1}^n|x_u|\tag{C19} \end{align}$

上述范数分别对应于两点间的闵可夫斯基距离的不同情况【西瓜书式(9.18) $\,\thicksim$ (9.20)】，其中，欧几里得范数 $L_2$ 对应欧几里得距离（欧氏距离）。

上述范数是由距离公式类比出的，下面进一步对向量范数进行扩充（与距离无关）：
$\begin{align} & \text{$L_{\infty}$：}\| \boldsymbol{x} \|_{\infty} =\mathop{\max}\limits_{1\leqslant u\leqslant n}\ |x_u| \tag{C20} \\ & \text{$L_{-\infty}$：}\| \boldsymbol{x} \|_{-\infty} =\mathop{\min}\limits_{1\leqslant u\leqslant n}\ |x_u| \tag{C21} \\ & \text{$L_0$：}\| \boldsymbol{x} \|_0 =\sum_{u=1}^n\mathbb{I} (x_u \neq 0)\quad \text{（即非零分量的个数）} \tag{C22} \end{align}$

向量范数还可以推广到矩阵：通过把矩阵张成向量来定义，如，由向量的 $L_2$ 范数定义矩阵 $\mathbf{A}$ 的Frobenius范数为
$\begin{align} \| \mathbf{A} \|_F =\sqrt{\left(\sum_{i=1}^m\sum_{j=1}^nA_{ij}^2\right)} \tag{C23} \end{align}$
即为【西瓜书附录式(A.15)】。

本文为原创，您可以：

点赞（支持博主）
收藏（待以后看）
转发（他考研或学习，正需要）
评论（或讨论）
引用（支持原创）
不侵权

上一篇：6、指示函数及应用（将分段函数表达成一个式子的技术）
下一篇：8、协方差矩阵的特征值

人工干智能

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
（《机器学习》完整版系列）附录 ——7、有趣的距离与范数（距离是两点之间的，如果将一个点固定在原点，则为向量的范数）

聚类的相似度通常用距离来刻划，距离又分为“（度量）距离”和“非度量距离”，“度量距离”由四条基本性质而“非度量距离”少满足一条（即不满足直递性）。距离是两点之间的（公式中含有这两点的坐标），如果我们将一个点固定在原点，则相应公式就变为只含一个点（向量）了，称为向量的范数。
复制链接

扫一扫

专栏目录