深度学习100问4-测量向量间相似度的方法有那些


 
一、欧氏距离
欧氏距离就是算两个向量在空间里的直线距离。要是

两个向量完全一样,那欧氏距离就是 0。距离越大,就说明越不相似。比如说在二维空间里有两个向量,一个是(1,2),另一个是(4,5),用欧氏距离的公式算一下,就能得到它们的距离。欧氏距离的好处就是很容易懂,算起来也简单,不过它对向量的各个部分都一样看待,没考虑不同部分的重要性不一样。
 
二、余弦相似度
余弦相似度是算两个向量夹角的余弦值来看看它们像不像。夹角越小,余弦值就越接近 1,那就说明越相似。比如有两个向量,一个是(1,1),另一个是(2,2),算一下它们的点积,再算一下模,然后就能算出余弦相似度是 1,这就说明这两个向量特别像。余弦相似度的好处是不管向量多长,只看方向,所以很适合比较文本向量啥的。
 
三、皮尔逊相关系数
皮尔逊相关系数是看两个变量之间的线性相关程度的,也能用来量向量的相似度。它的值在 -1 到 1 之间,越接近 1 就说明正相关越强,越接近 -1 就说明负相关越强,0 就是不相关。算的时候,先算两个向量的均值,然后算每个元素和均值的差,再根据这些差来算相关系数。比如有两个向量,一个是(2,3,4),另一个是(3,4,5),算一下均值和差值向量,就能算出皮尔逊相关系数是 1,说明这两个向量线性相关程度很高。皮尔逊相关系数会考虑变量的均值和变化趋势,对有线性关系的向量比较管用。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值