概述 在分类和聚类任务中,需要用到距离度量评估样本之间的相似度。 距离度量方法需要满足:1)样本到自身的距离为0;2)距离满足非负性;3)对称性,即A到B的距离与B到A的距离相同;4)三角形法则,即两边和大于第三边。 距离度量的选择会影响到分类或聚类算法的效果,这里总结一些常见的距离度量方法。 一、距离 距离是在论文中最常出现的距离度量方式之一,距离越大相似度越小。直白地说,距离就是对两个样本在每个维度上的差距取次方后求和并开次方根(≥1)。 距离越大,相似度越小。 在特征空间中取两个n维实数向量和,,。