利用python计算各类距离

利用python计算各类距离:https://www.jb51.net/article/164673.htm

1.闵可夫斯基距离(Minkowski Distance)

闵可夫斯基距离不是一个距离,而是一组距离的定义。其中 p 代表空间的维数,当 p=1 时,就是曼哈顿距离;当 p=2 时,就是欧氏距离;当 p→∞时,就是切比雪夫距离。

2.欧氏距离(Euclidean Distance)

3.曼哈顿距离(Manhattan Distance)

曼哈顿距离在几何空间中用的比较多。以下图为例,绿色的直线代表两点之间的欧式距离,而红色和黄色的线为两点的曼哈顿距离。所以曼哈顿距离等于两个点在坐标系上绝对轴距总和。

4.切比雪夫距离(Chebyshev Distance)

5.夹角余弦(Cosine)

余弦距离实际上计算的是两个向量的夹角,是在方向上计算两者之间的差异,对绝对数值不敏感。在兴趣相关性比较上,角度关系比距离的绝对值更重要,因此余弦距离可以用于衡量用户对内容兴趣的区分度。比如用搜索引擎搜索某个关键词,它还会推荐其他的相关搜索,这些推荐的关键词就是采用余弦距离计算得出的。

6.汉明距离(Hamming distance)

7.杰卡德相似系数(Jaccard similarity coefficient)

8.贝叶斯公式

相关性

方法1:通过numpy的corrcoef

x = [52,19,7,33,2]
y = [162,61,22,100,6]
num.corrcoef(x,y)

方法2:通过pandas的corr

data = pandas.DataFrame({'x':x, 'y':y})
data.corr()

Jaccard相似度

1、当两个集合元素个数相同,则直接调包

from numpy import *
import scipy.spatial.distance as dist  # 导入scipy距离公式
matV = mat([[1,1,0,1,0,1,0,0,1],[0,1,1,0,0,0,1,1,1]])
print ("dist.jaccard:", dist.pdist(matV,'jaccard'))

2、当集合元素个数不同

def correlation(set_a,set_b):
    unions = len(set_a.union(set_b))
    intersections = len(set_a.intersection(set_b))
    return 1. * intersections / unions

 

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值