由上述公式可知,明考斯基距离是欧氏距离的拓展,即当h =2时,明考斯基距离就成为了欧氏距离。以上的三种相似度计算方法都常用于文本之间的距离计算中。其中,欧氏距离应用更为广泛,因为其算法原理更为简单,它计算的是多维空间中两点之间的直线距离,而余弦夹角相似度则是计算多维向量空间中两个向量之间的夹角大小,表达相似性的方法要更为直观简洁、易懂易操作,故而在文本挖掘研究中更为常用。
由上述公式可知,明考斯基距离是欧氏距离的拓展,即当h =2时,明考斯基距离就成为了欧氏距离。以上的三种相似度计算方法都常用于文本之间的距离计算中。其中,欧氏距离应用更为广泛,因为其算法原理更为简单,它计算的是多维空间中两点之间的直线距离,而余弦夹角相似度则是计算多维向量空间中两个向量之间的夹角大小,表达相似性的方法要更为直观简洁、易懂易操作,故而在文本挖掘研究中更为常用。