机器学习 距离 相似度

余弦:空间角度上的相似   

皮尔森:计算离散度  协方差 单位化 (去量纲) 

杰卡德:交集/并集    集合中元素相似度 计算样本相似度  网页去重 论文查重  

 

向量空间余弦相似度:https://www.cnblogs.com/dsgcBlogs/p/8619566.html

余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量

基于句子词频计算余弦相似度  计算句子相似性   越接近1 夹角越趋于0  越相似

调整余弦相似度: 计算余弦前 每个维度先减去平均值   提高对数值的敏感度

 

 

https://blog.csdn.net/huangfei711/article/details/78456165

皮尔森相关系数:  协方差 单位化  量化两个变量的相关度

 

 

 

余弦距离使用两个向量夹角的余弦值作为衡量两个个体间差异的大小。相比欧氏距离,余弦距离更加注重两个向量在方向上的差异。

用于实值向量空间的度量标准 曼哈顿 欧拉 切比雪夫 明式距离为代表

 

http://www.cocoachina.com/articles/10238

https://blog.csdn.net/u011001084/article/details/52980834

用于二维向量空间的 度量请注意,半径距离度量需要[纬度,经度]形式的数据,并且输入和输出都以弧度为单位。

计算地球上  地理位置距离    基于球面模型的地理空间距离计算公式  

 

Haversine公式性能  根据2个经纬度点,计算这2个经纬度点之间的距离(通过经度纬度得到距离)

 

 

 

三、用于整数值向量空间的度量: 虽然用于整数值向量,但在实值向量的情况下,这些也是有效度量。

四、用于布尔值向量空间的度量标准: 任何非零条目都将计算为“True”。在下面的清单中,使用以下缩写:

五、用户定义的距离:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值