机器学习相似度度量

最新推荐文章于 2024-10-17 21:24:58 发布

原创

最新推荐文章于 2024-10-17 21:24:58 发布 · 2.1k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #相似性计算 #马氏距离 #夹角余弦 #闵可夫斯基距离

本文总结了机器学习中常见的相似性度量策略，包括欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、马氏距离、夹角余弦、相关系数、汉明距离和杰卡德相似系数，详细阐述了它们的定义和应用，帮助理解这些度量在解决实际问题中的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在机器学习中，无论是分类问题、聚类问题或降维问题，经常需要度量不同样本之间的相似性。不过如何友好地表征不同样本之前的相似性？通常采用的方法就是计算样本间的“距离”。

距离计算方法有很多，对于实际遇到的问题到底采用什么样的方法来计算距离是很讲究的，因为相似性度量的好坏很多时候直接关系到原始问题的求解结果。为了加深大家对各个距离方法的理解，本文就对常用的相似性度量策略作一个总结，希望对各位后续处理机器学习问题有所帮助。

欧式距离

欧氏距离是一个通常采用的距离定义，指在 $n$ 维空间中两个点之间的真实距离，或者向量的自然长度（即该点到原点的距离）。两个 $n$ 维向量 $\textbf{x}_1=(x_{11},x_{12},\ldots,x_{1n})$ 与 $\textbf{x}_2=(x_{21},x_{22},\ldots,x_{2n})$ 间的欧氏距离为

d (x 1, x 2) = \sum i = 1 n (x 1 i - x 2 i) 2 ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾  ⎷   .

$d(\textbf{x}_1,\textbf{x}_2)=\sqrt{\sum^{n}_{i=1}(x_{1i}-x_{2i})^{2}}.$

曼哈顿距离

曼哈顿距离是由十九世纪的赫尔曼·闵可夫斯基所创的词汇，是一种使用在几何度量空间的几何学用语，用以标明两个点在标准坐标系上的绝对轴距总和。两个 $n$ 维向量 $\textbf{x}_1=(x_{11},x_{12},\ldots,x_{1n})$ 与 $\textbf{x}_2=(x_{21},x_{22},\ldots,x_{2n})$ 间的曼哈顿距离为

d (x 1, x 2) = \sum i = 1 n | x 1 i - x 2 i | .

$d(\textbf{x}_1,\textbf{x}_2)=\sum^{n}_{i=1}|x_{1i}-x_{2i}|.$

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。