机器学习中五种常见的计算距离的方法

最新推荐文章于 2024-03-26 19:38:06 发布

瑾言-自强不息

最新推荐文章于 2024-03-26 19:38:06 发布

阅读量529

点赞数

分类专栏：线性代数文章标签：机器学习算法线性代数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Guoguounique/article/details/130288894

版权

线性代数专栏收录该内容

1 篇文章 0 订阅

订阅专栏

计算距离的五种方法

距离计算方法

在机器学习中，我们常常需要计算不同点之间的距离。下面是几种常见的距离计算方法：

欧几里得距离

欧几里得距离是两点之间的直线距离，即勾股定理中的斜边长度。假设有两个点A(x1, y1)和B(x2, y2)，则它们之间的欧几里得距离为：

d(A,B) = sqrt((x2-x1)^2 + (y2-y1)^2)

曼哈顿距离

曼哈顿距离是两点在网格上行走的距离，即两点在横纵坐标上的距离之和。假设有两个点A(x1, y1)和B(x2, y2)，则它们之间的曼哈顿距离为：

d(A,B) = |x2-x1| + |y2-y1|

Euclidean-欧几里得

manhatten-曼哈顿

minowsk-闵可夫斯基

chebyshew-切比雪夫

cosine distance-余弦距离

闵可夫斯基距离

闵可夫斯基距离是欧几里得距离和曼哈顿距离的一般化。假设有两个点A(x1, y1)和B(x2, y2)，则它们之间的闵可夫斯基距离为：

d(A,B) = (|x2-x1|^p + |y2-y1|^p)^(1/p)

当p=1时，变成曼哈顿距离；当p=2时，变成欧几里得距离。

切比雪夫距离

切比雪夫距离是两点在网格上行走的最大距离，即横纵坐标之差的最大值。假设有两个点A(x1, y1)和B(x2, y2)，则它们之间的切比雪夫距离为：

余弦距离

在讲余弦距离之前，我们必须弄清楚什么是向量的点乘。

向量的点乘（一）_向量点乘_大熊背的博客-CSDN博客

余弦距离是两个向量之间的夹角余弦值，它衡量的是两个向量方向上的差异。假设有两个向量A和B，则它们之间的余弦距离为：

d(A,B) = cos(theta) = (A*B) / (|A| * |B|)

其中，A*B表示A和B的点积，|A|和|B|分别表示A和B的模长。

为什么我老师给的公式是1-cos(theta)

因为余弦相似度的取值范围是[-1, 1]，越接近1表示两个向量越相似，越接近-1表示两个向量越不相似。而距离度量一般是越小表示越相似，因此一般会使用1减去余弦相似度来作为余弦距离。这样，余弦距离的取值范围就是[0, 2]，越接近0表示两个向量越相似，越接近2表示两个向量越不相似。

余弦距离的应用

余弦距离广泛应用于文本分类、信息检索、图像处理等领域。在文本分类中，我们可以将文档表示为词袋模型，然后计算文档之间的余弦相似度，从而进行分类。在信息检索中，我们可以将用户查询表示为向量，然后计算查询向量和文档向量之间的余弦相似度，从而实现搜索结果的排序。在图像处理中，我们可以将图像表示为向量，然后计算图像之间的余弦距离，从而实现图像的相似性比较和检索。

余弦距离的优点在于它不受向量长度的影响，而只取决于它们的夹角。这使得余弦距离在高维空间中非常有效，因为在高维空间中，向量之间的夹角往往更能反映它们之间的关系。另外，余弦距离不需要对向量进行归一化，因为在计算中除了向量的模长，其它部分都相同，所以可以省略这个步骤。

瑾言-自强不息

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
机器学习中五种常见的计算距离的方法

在机器学习中，我们常常需要计算不同点之间的距离。
复制链接

扫一扫

专栏目录

瑾言-自强不息

CSDN认证博客专家 CSDN认证企业博客

码龄2年

3: 原创

166万+: 周排名

108万+: 总排名

1655: 访问

: 等级

65: 积分

1: 粉丝

1: 获赞

2: 评论

2: 收藏

私信

关注

热门文章

分类专栏

线性代数 1篇
machine learning 1篇

最新评论

机器学习中五种常见的计算距离的方法
CSDN-Ada助手: 非常感谢用户分享这篇关于机器学习中计算距离方法的博客，你的文章非常详细，让我更深入地了解了这个话题。祝贺你能够持续不断地创作内容，这对于自己的学习与分享都是非常有益的。希望你在以后的创作中能够更加深入地探究机器学习领域的其他话题，期待你的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
机器学习中五种常见的计算距离的方法
CSDN-Ada助手: 非常感谢你的分享，这篇博客对于了解机器学习中计算距离的方法非常有帮助。恭喜你已经写了三篇博客，希望你能继续保持创作的热情，分享更多的知识和经验。我建议你可以深入探讨机器学习中的一些应用案例，这将有助于更好地理解和应用机器学习的知识。再次感谢你的分享！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。