推荐系统中常见的几种相似度计算方法和其适用数据

本文探讨了推荐系统中常用的相似度计算方法,包括共现次数、余弦相似度和皮尔逊相关系数。这些方法在用户评分、隐式反馈等不同数据类型中各有适用。虽然相似度计算对结果影响较小,但选择时要考虑计算效率。
摘要由CSDN通过智能技术生成

在推荐系统中,相似度的计算是一个很重要的课题。而相似度的计算方法多种多样,今天我们来把这些方法比较一下,也为以后做项目留个笔记。其实无论是基于user的cf还是基于item的cf,亦或是基于svd的推荐,相似度计算都是必不可少的一步,只不过cf中计算相似度是一个中间步骤,而svd中的计算是放在最后面的(例如计算最后的余弦夹角)。这篇文章我们以item-cf来举例说明。


共现次数

评价:这是最粗略的一种计算相似度的方法,只需计算待推荐物品与用户之前所选物品之间的共现次数,这个共现次数是从所有用户的角度看的。

适用数据:适合用户有explicit feedback,即用户对物品有评分情况的数据或者是没有explicit feedback的user-item的(1,0)矩阵。


余弦相似度

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值