余弦:空间角度上的相似
皮尔森:计算离散度 协方差 单位化 (去量纲)
杰卡德:交集/并集 集合中元素相似度 计算样本相似度 网页去重 论文查重
向量空间余弦相似度:https://www.cnblogs.com/dsgcBlogs/p/8619566.html
余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量
基于句子词频计算余弦相似度 计算句子相似性 越接近1 夹角越趋于0 越相似
调整余弦相似度: 计算余弦前 每个维度先减去平均值 提高对数值的敏感度
https://blog.csdn.net/huangfei711/article/details/78456165
皮尔森相关系数: 协方差 单位化 量化两个变量的相关度
余弦距离使用两个向量夹角的余弦值作为衡量两个个体间差异的大小。相比欧氏距离,余弦距离更加注重两个向量在方向上的差异。
用于实值向量空间的度量标准 曼哈顿 欧拉 切比雪夫 明式距离为代表
http://www.cocoachina.com/articles/10238
https://blog.csdn.net/u011001084/article/details/52980834
用于二维向量空间的 度量:请注意,半径距离度量需要[纬度,经度]形式的数据,并且输入和输出都以弧度为单位。
计算地球上 地理位置距离 基于球面模型的地理空间距离计算公式
Haversine公式性能 根据2个经纬度点,计算这2个经纬度点之间的距离(通过经度纬度得到距离)
三、用于整数值向量空间的度量: 虽然用于整数值向量,但在实值向量的情况下,这些也是有效度量。
四、用于布尔值向量空间的度量标准: 任何非零条目都将计算为“True”。在下面的清单中,使用以下缩写:
五、用户定义的距离: