论文笔记|The Wisdom of The Few

本文对比了userCF和expertCF算法,专家评分更稠密、一致,减少了噪声。expertCF在评分预测精度和覆盖率上表现良好,尤其在冷启动场景下,实验结果显示expertCF推荐质量更优。
摘要由CSDN通过智能技术生成

今天读了The Wisdom of the Few这篇文章,这里稍作整理。
在推荐系统中,最经典的莫过于协同过滤算法,分为基于用户的协同过滤算法userCF与基于商品的协同过滤算法itemCF,本质上为寻找与你最相近的用户购买的商品或者与你购买过的商品最相近的商品。这两种算法首先都需要建立用户与商品的关系矩阵,值为用户对商品的评价打分或者0/1表示是否用户与商品有过购买等行为。在实际应用场景中,关系矩阵存在高维、稀疏的特性,在进行计算推荐结果时,需要解决高维稀疏向量之间的相似度并进行排序,存在较大的运算复杂度。另一方面,针对冷启动问题,在新用户加入时,如何进行合理的推荐。与根据其他用户进行推荐的思路不同,本文提出了一种根据与“专家”行为相似度进行推荐的思路。在这里,“专家”的定义为在特定领域给出可靠、一致评分的人。
文章首先对比了两个数据集,一个是来自Netflix的普通用户评分数据集,一个是来自网上150个影评专家的评分数据。对比CDF曲线发现,专家给出的评分更加稠密(每位专家观影量较多),而普通用户数据集更大。另外,每个专家的评分数量、每部电影的专家评分数量更加均匀,相比之下普通用户数据集可能存在热门影片的评分远比冷门影片多的情况。对比标准差发现,专家们对同一部电影的评分相对一致,标准差较小(大概在一定程度上表明恶意评分等现象的影响较小),存在更少的噪声。
本文中对比了userCF与expertCF的算法效果,包括评分预测的精确度(平均绝对误差)TopN推荐结果的precision。相似度的计算方式采取的是一种余弦相似度的变形
s i m ( a , b ) = ∑ ( r a i r b i ) ∑ r a i 2 ∑ r b i 2 2 N a ∪ b N a + N b sim(a,b)=\frac{\sum{(r_{ai}r_{bi})}}{\sqrt{\sum{r_{ai}^{2}}}\sqrt{\sum{r_{bi}^{2}}}}\frac{2N_{a\cup b}}{N_a+N_b} sim(a,b)=rai

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值