前言
在机器学习中,距离度量在CV 、NLP以及数据分析等领域都有众多的应用。最常见的距离度量有余弦距离
。本篇文章内容,主要将余弦距离中涉及到的高中数学知识重新捡起来,以便加深理解。
相关概念
余弦相似度
余弦相似度又称为余弦相似性,是通过计算两个向量
的夹角余弦值
来评估他们的相似度。余弦相似度将向量根据坐标值,绘制到向量空间中,如最常见的二维空间。
余弦相似度计算公式
余弦相似度
=
A
⋅
B
∥
A
∥
⋅
∥
B
∥
\text{余弦相似度} = \frac{A \cdot B}{\|A\| \cdot \|B\|}
余弦相似度=∥A∥⋅∥B∥A⋅B
其中,A · B 表示向量 A 和 B 的点积(内积),|A| 和 |B| 分别表示向量 A 和 B 的模长。
通过以上公式,可以看到其中涉及的数学知识有:
- 向量
- 向量的模长
- 向量的基本计算
- 向量的内积
- 向量的投影
- 余弦夹角
- 余弦定理
…
- 余弦定理
为了系统掌握上述内容,我们对以上数学知识进行重新梳理。
向量
向量的定义
向量是具有大小和方向的量,通常用箭头表示。在数学中,向量可以用来表示空间中的点、力、速度等概念。
在数学和物理学中,"矢量"和"向量"这两个术语通常被用来表示相同的概念,即具有大小和方向的量。它们之间没有本质上的区别,可以互相替换使用。
在数学中,我们通常使用"向量"这个术语来表示这种量;
在物理学中,更常见的是使用"矢量"这个术语来描述这种性质。
向量的大小
向量的大小通常称为模长
或长度,表示向量的大小或量级。在二维空间中,向量的大小可以通过勾股定理计算得出。
表示方法:一般是在向量表示符两侧增加竖线|A|
向量的方向
向量的方向是指向量所指的位置或指向。在二维空间中,方向通常用与 x 轴的夹角来表示。
两个向量常见的方向关系有:平行向量、垂直向量和其他。
向量的计算
向量的加法
向量加法是将两个向量相加的操作。对于二维向量
a
⃗
=
A
B
⃗
\vec{a} = \vec{AB}
a=AB
和
b
⃗
=
B
C
⃗
\vec{b} = \vec{BC}
b=BC
它们的和为:
a
⃗
+
b
⃗
=
A
B
⃗
+
B
C
⃗
=
A
C
⃗
\vec{a} + \vec{b} = \vec{AB} + \vec{BC} = \vec{AC}
a+b=AB+BC=AC
向量的减法
向量减法是将一个向量减去另一个向量的操作。对于二维向量
O
A
⃗
=
(
a
1
,
a
2
)
\vec{OA} = (a_1, a_2)
OA=(a1,a2)
和
O
B
⃗
=
(
b
1
,
b
2
)
\vec{OB} = (b_1, b_2)
OB=(b1,b2)
它们的差为:
O
A
⃗
−
O
B
⃗
=
O
A
⃗
+
(
−
O
B
⃗
)
=
O
A
⃗
+
B
O
⃗
=
B
O
⃗
+
O
A
⃗
=
B
A
⃗
\vec{OA} - \vec{OB} = \vec{OA} + (-\vec{OB}) = \vec{OA} + \vec{BO} = \vec{BO} + \vec{OA} = \vec{BA}
OA−OB=OA+(−OB)=OA+BO=BO+OA=BA
向量的数乘
数量乘法是将一个标量与一个向量相乘的操作。标量乘以向量时,会使向量的大小增大或缩小,但方向不变。例如,标量lambda 与二维向量
A
⃗
=
(
a
1
,
a
2
)
\vec{A} = (a_1, a_2)
A=(a1,a2)
的乘积为:
λ
A
⃗
=
(
λ
a
1
,
λ
a
2
)
\lambda\vec{A} = (\lambda a_1, \lambda a_2)
λA=(λa1,λa2)
向量的内积
点积是一种向量运算,也称为内积。对于二维向量
A
⃗
=
(
a
1
,
a
2
)
\vec{A} = (a_1, a_2)
A=(a1,a2)
和
B
⃗
=
(
b
1
,
b
2
)
\vec{B} = (b_1, b_2)
B=(b1,b2)
它们的点积为:
A
⃗
⋅
B
⃗
=
a
1
b
1
+
a
2
b
2
\vec{A} \cdot \vec{B} = a_1b_1 + a_2b_2
A⋅B=a1b1+a2b2
向量的投影
向量的投影是指一个向量在另一个向量上的投影,可以帮助我们理解向量之间的关系和计算向量之间的夹角。
正余弦定理
正弦定理
- 定义:正弦定理描述了三角形中角度和边长之间的关系。对于三角形 ABC,其三个顶点分别为 A、B、C,对应的边长分别为 a、b、c,以及对应的角度为 A、B、C,则正弦定理可以表示为:
a sin A = b sin B = c sin C \frac{a}{\sin A} = \frac{b}{\sin B} = \frac{c}{\sin C} sinAa=sinBb=sinCc - 应用:可用于计算三角形中缺失的边长或角度,特别适用于非直角三角形。
余弦定理
- 定义:余弦定理描述了三角形中边长和角度之间的关系。对于三角形 ABC,其三个顶点分别为 A、B、C,对应的边长分别为 a、b、c,以及对应的角度为 A、B、C,则余弦定理可以表示为:
−
a
2
=
b
2
+
c
2
−
2
b
c
cos
A
- a^2 = b^2 + c^2 - 2bc \cos A
−a2=b2+c2−2bccosA
−
b
2
=
a
2
+
c
2
−
2
a
c
cos
B
- b^2 = a^2 + c^2 - 2ac \cos B
−b2=a2+c2−2accosB
−
c
2
=
a
2
+
b
2
−
2
a
b
cos
C
- c^2 = a^2 + b^2 - 2ab \cos C
−c2=a2+b2−2abcosC
- 应用:可用于计算三角形中的边长或角度,特别适用于已知两边和夹角的情况。