1.相似性:两个对象相似程度的数值度量。相似度是非负的,在0(不相似)和1(完全相似)之间取值。
2.相异性:两个对象差异程度的度量,对象越相似,相异度越低。相异度的同义词是距离。
3.相似度与相异度的度量方法:
①欧式距离(将样本看作一个点)
在m维的空间中2点之间的真实距离。
距离越短,两点相似度越大,反之亦然
②曼哈顿距离(可以如此理解:看网格中的距离,并不看直接连线)
③明可夫斯基距离(明式距离是欧式距离距离的推广)
在公式中:
P==1,明式距离就是曼哈顿距离
P==2,明式距离就是欧式距离
P 趋近于无穷大 ,即为切比雪夫距离
④马式距离(通常是指样本集的相似度)
数据的协方差方差距离
⑤余弦相似度
(看两个向量的夹角)
⑥Jaccard相似度
真懒惰啊 好好鞭策自己