【Matlab】利用pdist和pdist2求各种距离

最新推荐文章于 2024-11-13 22:03:37 发布

CallMeJacky

最新推荐文章于 2024-11-13 22:03:37 发布

阅读量1.1w

点赞数 8

分类专栏： Matlab编程与绘图

Matlab编程与绘图专栏收录该内容

44 篇文章

订阅专栏

本文详细介绍了多种距离计算方法，包括欧几里德距离、标准欧几里德距离、马哈拉诺比斯距离、曼哈顿距离等，并讨论了它们在不同场景下的应用及优缺点。同时，还介绍了Matlab中pdist和pdist2函数的使用方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.各种距离介绍

（1）.欧几里德距离Euclidean distance('euclidean')

虽然很有用，但也有明显的缺点：
a.它将样品的不同属性（即各指标或各变量）之间的差别等同看待，这一点有时不能满足实际要求；
b.它没有考虑各变量的数量级(量纲)，容易犯大数吃小数的毛病。所以，可以先对原始数据进行规范化处理再进行距离计算。
（2）标准欧几里德距离Standardized Euclidean distance('seuclidean')

相比单纯的欧氏距离，标准欧氏距离能够有效的解决上述缺点。注意，这里的V在许多Matlab函数中是可以自己设定的，不一定非得取标准差，可以依据各变量的重要程度设置不同的值，如knnsearch函数中的Scale属性。
（3）马哈拉诺比斯距离Mahalanobis distance('mahalanobis')

马氏距离是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的，表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧式距离不同的是它考虑到各种特性之间的联系（例如：一条关于身高的信息会带来一条关于体重的信息，因为两者是有关联的）并且是尺度无关的(scale-invariant)，即独立于测量尺度。
如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧式距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离.
马氏优缺点：

　　1）马氏距离的计算是建立在总体样本的基础上的，因为C是由总样本计算而来，所以马氏距离的计算是不稳定的；

　　2）在计算马氏距离过程中，要求总体样本数大于样本的维数。

　　3）协方差矩阵的逆矩阵可能不存在。

（4）曼哈顿距离(城市区块距离)City block metric('cityblock')