简单易懂的余弦相似度与欧式距离

本文详细介绍了余弦相似度和欧式距离的概念及其计算方式。余弦相似度衡量的是两个向量在方向上的相似性,范围在-1到1之间,1表示完全相同,-1表示方向相反。欧式距离则衡量的是向量之间的实际距离,适用于各种维度的空间。当向量归一化后,欧式距离与余弦距离在数值上接近。这两种度量在不同场景下各有优势,余弦相似度关注方向,而欧式距离关注绝对差异。
摘要由CSDN通过智能技术生成

1、余弦相似度

给定两个属性向量,AB,其余弦相似性θ由点积和向量长度给出,如下所示:

符号表示:

 

 

image.png

其中:image.png分别代表向量A和B的各分量

数值表示

(二维)

image

 

image.gif

(高维)

image.png

 

image.gif

给出的相似性范围从-1到1:

-1意味着两个向量指向的方向正好截然相反,1表示它们的指向是完全相同的,0通常表示它们之间是独立的,而在这之间的值则表示中间的相似性或相异性。

 

余弦距离:

image.png

2、欧式距离

N维欧氏空间中两点间的距离公式:

image.png

 

3、二者关系

标准化之后的欧式距离近似于余弦距离

证明如下:

证法一:

假设二维空间两个点,

 

然后归一化为单位向量

 

那么余弦相似度为:

 

 

欧式距离为:

 

化简后结果:

作图如下:

image.png

可以从图像上看到二者的值比较接近

对于高维空间与二维类似

 

证法二:

余弦相似度的定义公式为

image.png

归一化后

image.png

余弦距离:

image.png

欧式距离:

image.png

由公式可以看出归一化后,欧式距离与余弦距离存在单调性关系,此时两种距离的值域都为[0,2]。

欧式距离与余弦距离的对比:

1.欧式距离的数值受到维度的影响,余弦相似度在高维的情况下也依然保持低维完全相同时相似度为1等性质。

2.欧式距离体现的是距离上的绝对差异,余弦距离体现的是方向上的相对差异。

 

参考:

https://www.zhihu.com/question/19640394

https://www.cnblogs.com/airnew/p/9563703.html

https://blog.csdn.net/lucky_kai/article/details/89514868

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值