"L2"代表欧氏距离的原因,
这来源于数学中的范数(norm)概念
。
什么是范数
在数学中,
向量的范数
是一种度量
向量大小或长度的方式。
对于一个n维向量 x = ( x 1 , x 2 , … , x n ) \mathbf{x} = (x_1, x_2, \ldots, x_n) x=(x1,x2,…,xn),
其p-范数(p-norm)
定义如下:
∣
∣
x
∣
∣
p
=
(
∑
i
=
1
n
∣
x
i
∣
p
)
1
/
p
||\mathbf{x}||_p = \left( \sum_{i=1}^{n} |x_i|^p \right)^{1/p}
∣∣x∣∣p=(i=1∑n∣xi∣p)1/p
其中,
p
p
p是范数的阶次
。
当
p
=
2
p = 2
p=2时,我们得到的就是2-范数(2-norm)
,它也是最常见的范数形式之一
,通常简称为L2范数
。
范数公式的解析
让我们逐步解析这个公式:
∣ ∣ x ∣ ∣ p = ( ∑ i = 1 n ∣ x i ∣ p ) 1 / p ||\mathbf{x}||_p = \left( \sum_{i=1}^{n} |x_i|^p \right)^{1/p} ∣∣x∣∣p=(i=1∑n∣xi∣p)1/p
-
x \mathbf{x} x: 这是一个向量,通常表示为 ( x 1 , x 2 , . . . , x n ) (x_1, x_2, ..., x_n) (x1,x2,...,xn),其中 x 1 , x 2 , . . . , x n x_1, x_2, ..., x_n x1,x2,...,xn 是向量的各个分量。
-
∣ ⋅ ∣ |\cdot| ∣⋅∣: 这是绝对值符号,应用于每一个分量 x i x_i xi 上,确保即使分量是负数,其在后续的运算中也不影响最终结果的大小。
-
∑ i = 1 n \sum_{i=1}^{n} ∑i=1n: 这是求和符号,表示从 i = 1 i=1 i=1 到 i = n i=n i=n 对所有项进行求和。这里的 n n n 表示向量的维数,也就是向量包含的元素数量。
-
∣ x i ∣ p |x_i|^p ∣xi∣p: 这是向量每个分量 x i x_i xi 的 p p p 次方的绝对值。这意味着我们对向量的每个分量取绝对值后再进行 p p p 次幂运算。
-
( ⋅ ) 1 / p \left( \cdot \right)^{1/p} (⋅)1/p: 这表示对之前求和的结果再进行 p p p 次根号运算。如果 p = 2 p=2 p=2,这就是平方根;如果 p = 3 p=3 p=3,则是立方根,以此类推。
-
( ⋅ ) \left( \cdot \right) (⋅): 圆括号用于组织表达式,确保先进行括号内的运算。
-
∣ ∣ ⋅ ∣ ∣ p ||\cdot||_p ∣∣⋅∣∣p: 这表示 p p p-范数,是对向量 x \mathbf{x} x 的大小或长度的一种度量方式,其中 p p p 是范数的阶次。
综上所述,整个公式 ( ∑ i = 1 n ∣ x i ∣ p ) 1 / p \left( \sum_{i=1}^{n} |x_i|^p \right)^{1/p} (∑i=1n∣xi∣p)1/p 计算的是向量 x \mathbf{x} x 的 p p p-范数,
它是向量所有分量的 p p p 次方的绝对值之和的 p p p 次根。
当
p
=
2
p=2
p=2 时,这就是L2范数
或欧氏距离
;
欧式距离就是向量中所有分量平方和的平方根;
当
p
=
1
p=1
p=1 时,这是L1范数
或曼哈顿距离
。
曼哈顿距离就是向量中所有分量的绝对值的和。
欧氏距离的公式
对于两个向量 x \mathbf{x} x和 y \mathbf{y} y,
它们之间的L2距离
(也就是欧氏距离
)可以通过计算它们差的2-范数
来得到:
d ( x , y ) = ∣ ∣ x − y ∣ ∣ 2 = ∑ i = 1 n ( x i − y i ) 2 d(\mathbf{x}, \mathbf{y}) = ||\mathbf{x} - \mathbf{y}||_2 = \sqrt{\sum_{i=1}^{n} (x_i - y_i)^2} d(x,y)=∣∣x−y∣∣2=i=1∑n(xi−yi)2
因此,L2就成为了欧氏距离
的代名词,因为它直接来自于向量的2-范数
。
在机器学习
和数据分析
领域,
L2范数
和欧氏距离
经常被用来度量
向量之间的相似性
或差异性
。