在推荐系统中,相似度的计算是一个很重要的课题。而相似度的计算方法多种多样,今天我们来把这些方法比较一下,也为以后做项目留个笔记。其实无论是基于user的cf还是基于item的cf,亦或是基于svd的推荐,相似度计算都是必不可少的一步,只不过cf中计算相似度是一个中间步骤,而svd中的计算是放在最后面的(例如计算最后的余弦夹角)。这篇文章我们以item-cf来举例说明。
共现次数
评价:这是最粗略的一种计算相似度的方法,只需计算待推荐物品与用户之前所选物品之间的共现次数,这个共现次数是从所有用户的角度看的。
适用数据:适合用户有explicit feedback,即用户对物品有评分情况的数据或者是没有explicit feedback的user-item的(1,0)矩阵。
余弦相似度