本文将介绍一些数据挖掘、机器学习、信息检索等领域中常用的一些相似性、相关性度量指标:
(1)Euclidean Distance(欧几里德距离、欧氏距离)
设有两个向量,
它们之间的Euclidean Distance为:
,值越小越相似。
(2)Manhattan Distance(曼哈顿距离)
设有两个向量,
它们之间的Manhattan Distance为:
,值越小越相似。
(3)Minkowsk Distance(闵可夫斯基距离)
设有两个向量,
它们之间的Minkowsk Distance为:
,值越小越相似。
(4)Hamming<