基于欧几里得距离的相似度计算
【公式1】:欧几里得计算公式
作为计算结果的欧式值显示的是两点之间的直线距离,该值的大小表示两个物品或者用户差异性的大小,即用户的相似性如何。如果两个物品或者用户距离越大,那么相似性越小;反之,距离越小相似度越大。由于欧几里得相似度计算中最终数值的大小和相似度成反比,因此在实际中常常使用欧几里得距离的倒数作为相似度值,即1/d+1作为近似值。
【例子1】:欧几里得公式的应用
物品1(特征1) | 物品2(特征2) | 物品3(特征3) | 物品4(特征4) | |
用户1 | 1 | 1 | 3 | 1 |
用户2 | 1 | 2 | 3 | 2 |
用户3 | 2 | 2 | 1 | 1 |
如果计算用户1和其他用户之间的相似度,通过欧几里得距离公式可以得出:
从结果可知,用户1和用户2的相似度为1.414。用户1和用户3的相似度是:
因此可以得到用户2更加相似于用户1(距离越小,相似度越大)
基于余弦角度的相似度计算
【公式2】:余弦相似度计算公式
两条直线分别从坐标原点出发,引出一定的角度。如果两目标较为相似,那么其线段形成的夹角较小。因此在使用余弦度量的相似度计算中可以用夹角的大小来反映目标之间的相似性。
余弦值一般为[-1,1],这个值的大小与余弦夹角的大小成正比。夹角越小,余弦值越小,两目标越相似。
【例子2】:余弦相似度公式的应用
表1中用户1和用户2之间的相似性,结果如下:
用户1和用户3的相似性如下:
相对于用户3,用户2与用户1更为相似。
对比
欧几里得相似度注重目标之间的差异,与目标在空间的位置直接相关。
余弦相似度是不同目标在空间中的夹角,更加表现在前进的趋势上的差异。