推荐系统-相似度计算之三种算法
相似度计算(Similarity Calculation)方法:
欧氏距离, 是一个欧式空间下度量距离的方法. 两个物体, 都在同一个空间下表示为两个点, 假如叫做p,q, 分别都是n个坐标, 那么欧式距离就是衡量这两个点之间的距离.
注意⚠️:欧氏距离不适用于布尔向量之间
欧式距离公式
欧氏距离的值是一个非负数, 最大值正无穷, 通常计算相似度的结果希望是[-1,1]或[0,1]之间,一般可以使用
余弦相似度
1,度量的是两个向量之间的夹角, 用夹角的余弦值来度量相似的情况
2,两个向量的夹角为0是,余弦值为1, 当夹角为90度是余弦值为0,为180度是余弦值为-1
3,余弦相似度在度量文本相似度, 用户相似度 物品相似度的时候较为常用
4,余弦相似度的特点, 与向量长度无关,余弦相似度计算要对向量长度归一化, 两个向量只要方向一致,无论程度强弱, 都可以视为’相似’
余弦公式:
皮尔逊相关系数Pearson
1