距离的度量 Python
在机器学习和数据分析中,度量样本之间的相似性或差异性是一项重要任务。距离度量是一种常用的方法,用于计算样本之间的相似性或差异性。Python提供了许多用于计算距离的库和函数,本文将介绍几种常见的距离度量方法,并提供相应的源代码。
- 欧几里得距离(Euclidean Distance):
欧几里得距离是最常用的距离度量方法之一,它计算了两个样本之间的直线距离。在二维空间中,欧几里得距离的计算公式为:
import numpy as np
def euclidean_distance(x, y):
return np.sqrt(np.sum((x - y) ** 2))
其中,x和y是两个样本的特征向量。
- 曼哈顿距离(Manhattan Distance):
曼哈顿距离是另一种常见的距离度量方法,它计算了两个样本之间沿坐标轴的距离总和。在二维空间中,曼哈顿距离的计算公式为:
import numpy as np
def manhattan_distance(x, y):
return np.sum(np.abs(x - y))
- 切比雪夫距离(Chebyshev Distance