比较两个向量的相似性-python

参考:

https://blog.csdn.net/u011412768/article/details/86714540

1、余弦相似性(cosine)

这个函数的输入是n个长度相同的list或者array,函数的处理是计算这n个list两两之间的余弦相似性,最后生成的相似矩阵中的s[i][j]表示的是原来输入的矩阵中的第i行和第j行两个向量的相似性,所以生成的是n*n的相似性矩阵

from sklearn.metrics.pairwise import cosine_similarity
 
s = cosine_similarity([[1, 0, 0, 0]], [[1, 0, 0, 0]])
print(s)

2、使用scipy包中的距离计算,代码如下:

     这里的vec1和vec2都是一维的array向量。

from scipy.spatial.distance import cosine
 
vec1 = [1, 2, 3]
vec2 = [2, 3, 4]
s = cosine(vec1, vec2)
 
print(s)

3、皮尔森相关系数(pearson)

参考:scipy.stats.pearsonr — SciPy v1.9.3 Manual

from scipy import stats
import numpy as np
 
a = np.array([0, 0, 0, 1, 1, 1, 1])
b = np.arange(7)
s1 = stats.pearsonr(a, b)
 
s2 = stats.pearsonr([1,2,3,4,5], [5,6,7,8,7])
print("s1:", s1)
print("s2:", s2)

 4、欧式距离

      欧式距离,即欧几里得距离:

(1)已知vec1和vec2是两个Numpy array,即数组,使用numpy包计算:

import numpy
 
a = numpy.array([0, 0, 0, 1, 1, 1, 1])
b = numpy.arange(7)
 
dist = numpy.sqrt(numpy.sum(numpy.square(a - b)))
 
print(dist)

(2)

import numpy
 
a = numpy.array([0, 0, 0, 1, 1, 1, 1])
b = numpy.arange(7)
dist = numpy.linalg.norm(a - b)
 
print("dist:", dist)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值