数据的距离度量一、欧式距离，曼哈顿距离，闵氏距离，切比雪夫距离，兰氏距离，马氏距离

RuiH.AI

于 2022-11-14 16:15:10 发布

阅读量1.5k

点赞数

分类专栏：概率论与机器学习文章标签：数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41035283/article/details/127848562

版权

概率论与机器学习专栏收录该内容

50 篇文章 83 订阅

订阅专栏

数据的距离度量一、欧式距离，曼哈顿距离，闵氏距离，切比雪夫距离，兰氏距离，马氏距离

前言
欧式距离
标准欧式距离
曼哈顿距离
闵氏距离
切比雪夫距离
兰氏距离
马氏距离

前言

本篇记录一下常用的数据距离度量方法，欧式距离，曼哈顿距离，闵氏距离，切比雪夫距离，马氏距离，兰氏距离。

欧式距离

最常用的距离，用于衡量欧式空间中两点间的距离，等同于两个同维向量之差的2-范数，也称为L2距离：
$\sqrt {\sum_{i=1}^{n}(x_i - y_i)^2} = ||x-y||_2$

标准欧式距离

标准欧式距离是在存在大量样本点时，通过数据标准化后再计算欧式距离：
$\sqrt {\sum_{i=1}^{n} (\frac {(x_i - \mu_i )- (y_i- \mu_i)}{s_i})^2}$

曼哈顿距离

等同于两个同维向量之差的1-范数，也称为L1距离：
$\sum_{i=1}^{n}|x_i - y_i| = ||x-y||_1$

闵氏距离

等同于两个同维向量之差的p-范数：
$\sqrt [^p] {\sum_{i=1}^{n}|x_i - y_i|^p} {}= ||x-y||_p$

切比雪夫距离

等同于两个同维向量之差的无穷范数：
$\max({|x_i-y_i|})=||x-y||_\infin$

兰氏距离

$\sum_{i=1}^{n}\frac{|x_i - y_i|}{|x_i| + |y_i|}$

马氏距离

如果向量之间的某些维度具有相关性，欧式距离并不会考虑这些相关性。比如 $x_1, x_3$ 独立， $x_2=2x_1$ ，点(2, 4, 1)与(3, 6, 1)更近还是(1.5, 3, 1)更近呢？如果使用欧式距离，必然点(1.5, 3, 1)更近，但考虑到第0, 1维的函数关系，实际上应当把第二维拿掉再计算欧式距离，这时两点距离是相同的。

马氏距离通过协方差矩阵的逆来衡量各维度之间的关系（两维的协方差），并且去除了各维度自身的尺度影响（维度的方差）：
$\sqrt {(x - y)^T \Sigma^{-1} (x-y)}$

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
数据的距离度量一、欧式距离，曼哈顿距离，闵氏距离，切比雪夫距离，兰氏距离，马氏距离

本篇记录一下常用的数据距离度量方法，欧式距离，曼哈顿距离，闵氏距离，切比雪夫距离，马氏距离，兰氏距离。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。