常见距离计算的Python实现

本文详细介绍了在Python中如何使用numpy和scipy库来计算曼哈顿距离、欧式距离、切比雪夫距离、闵可夫斯基距离和汉明距离,以及余弦相似度。提供了直接公式计算、内置线性代数函数和scipy库函数的示例代码。
摘要由CSDN通过智能技术生成

常见的距离有曼哈顿距离、欧式距离、切比雪夫距离、闵可夫斯基距离、汉明距离、余弦距离等,用Python实现计算的方式有多种,可以直接构造公式计算,也可以利用内置线性代数函数计算,还可以利用scipy库计算。

1.曼哈顿距离

也叫城市街区距离,是两点差向量的L1范数,也就是各元素的绝对值之和。A(x1,x2,…,xn)和B(y1,y2,…,yn)之间的曼哈顿距离表示为
d = ∑ i = 1 n ∣ x i − y i ∣ d=\sum_{i=1}^{n}{\left| x_i-y_i \right|} d=i=1nxiyi

Python实现:

import numpy as np
from scipy.spatial import distance

A = np.array([1,2,3])
B = np.array([4,5,6])

# 方式一:直接构造公式计算
dist1 = np.sum(np.abs(A-B))

# 方式二:内置线性代数函数计算
dist2 = np.linalg.norm(A-B,ord=1)  #ord为范数类型,取值1(一范数),2(二范数),np.inf(无穷范数),默认2。

# 方式三:scipy库计算
dist3 = distance.cityblock(A,B)

2.欧式距离

是一种最常见的距离,也就是两点差向量的L2范数。A(x1,x2,…,xn)和B(y1,y2,…,yn)之间的欧式距离表示为
d = ∑ i = 1 n ( x i − y i ) 2 d=\sqrt{\sum_{i=1}^{n}{\left( x_i-y_i \right)^{2}}} d=i=1n(xiyi)2

Python实现:

import numpy as np
from scipy.spatial import distance

A = np.array([1,2,3])
B = np.array([4,5,6])

# 方式一:直接构造公式计算
dist1 = np.sqrt(np.sum((A-B)**2))

# 方式二:内置线性代数函数计算
dist2 = np.linalg.norm(A-B,ord=2)

# 方式三:scipy库计算
dist3 = distance.euclidean(A,B)

3.切比雪夫距离

最大的维度内距离,是两点差向量的无穷范数。A(x1,x2,…,xn)和B(y1,y2,…,yn)之间的切比雪夫距离表示为
d = m a x ( ∣ x i − y i ∣ ) d=max\left( \left| x_i-y_i \right| \right) d=max(xiyi)
Python实现:

import numpy as np
from scipy.spatial import distance

A = np.array([1,2,3])
B = np.array([4,5,6])

# 方式一:直接构造公式计算
dist1 = np.max(np.abs(A-B))

# 方式二:内置线性代数函数计算
dist2 = np.linalg.norm(A-B,ord=np.inf)

# 方式三:scipy库计算
dist3 = distance.chebyshev(A,B)

4. 闵可夫斯基距离

是一种范式距离的统称,可表示为两点差向量的Lp范数。A(x1,x2,…,xn)和B(y1,y2,…,yn)之间的闵可夫斯基距离表示为
d = ∑ i = 1 n ∣ x i − y i ∣ p p d=\sqrt[p]{\sum_{i=1}^{n}{\left| x_i-y_i \right|^{p}}} d=pi=1nxiyip
Python实现:

import numpy as np
from scipy.spatial import distance

A = np.array([1,2,3])
B = np.array([4,5,6])

# 方式一:内置线性代数函数计算
dist1 = np.linalg.norm(A-B,ord=3)  # np.linalg.norm(A-B,ord=p)

# 方式二:scipy库计算
dist2 = distance.minkowski(A,B,3)  # distance.minkowski(A,B,p)

5.汉明距离

衡量两个字符串之间的差异程度,对两个对象的向量元素逐个比较,差异的个数占总个数的比例。A(x1,x2,…,xn)和B(y1,y2,…,yn)之间的汉明距离表示为
d = 1 n ∑ i = 1 n I ( x i ≠ y i ) d=\frac{1}{n}\sum_{i=1}^{n}{I\left( x_i\ne y_i \right)} d=n1i=1nI(xi=yi)
其中I为指示函数,
KaTeX parse error: No such environment: equation at position 7: \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲}̲ I= \left\{ \be…
Python实现:

import numpy as np
from scipy.spatial import distance

A = np.array([1,2,3])
B = np.array([4,5,6])

# 方式一:scipy库计算
dist1 = distance.hamming(A,B)

6.余弦距离

也叫余弦相似度,是两点空间向量夹角的余弦值,是内积与模积的比值,用来衡量两向量间的差异程度。A(x1,x2,…,xn)和B(y1,y2,…,yn)之间的余弦距离表示为
KaTeX parse error: No such environment: align at position 7: \begin{̲a̲l̲i̲g̲n̲}̲ d&=cos\theta=\…
Python实现:

import numpy as np
from scipy.spatial import distance

A = np.array([1,2,3])
B = np.array([4,5,6])

# 方式一:直接构造公式计算
dist1 = np.sum(A*B)/(np.sqrt(np.sum(A**2))*np.sqrt(np.sum(B**2)))

# 方式二:scipy库计算
dist2 = 1-distance.cosine(A,B)

End.


参考:
https://blog.csdn.net/lemonbit/article/details/129053257

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

禺垣

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值