《The wisdom of the few》读书笔记

最新推荐文章于 2020-12-09 10:12:13 发布

ep_mashiro

最新推荐文章于 2020-12-09 10:12:13 发布

阅读量2.2k

点赞数 3

分类专栏：推荐系统文章标签：读书笔记推荐系统

本文链接：https://blog.csdn.net/tinkle181129/article/details/51234261

版权

该论文提出了expert-KNN方法，用专家评分替代用户评分以解决协同过滤中的数据稀疏、噪音、冷启动和可扩展性问题。通过对Netflix和Rotten Tomatoes数据的分析，结果显示专家CF在预测误差和Top-N精度上表现出色，尤其是在解决冷启动问题上优于传统用户CF。在实际推荐场景中，用户对基于专家评分的推荐反馈积极。

摘要由CSDN通过智能技术生成

                    
                        
                    
                    论文名称： 
 The wisdom of the few: a collaborative filtering approach based on expert opinions from the web
published in 
 Proceeding 
 SIGIR ‘09 Proceedings of the 32nd international ACM SIGIR conference on Research and development in information retrieval
文章链接 
 the wisdom of the few
文章组织架构 
 摘要、介绍 
 第二节：收集数据 
 第三节：描述算法 
 第四节：评估基于专家推荐在预测推荐的错误率和TOP-N推荐精度的指标 
 第五节：模拟实际推荐过程中随机、用户cf和专家cf的推荐效果
方法提出 
 user-KNN是常见的协同过滤方法，但是它有以下缺点： 
 数据稀疏：用户数量大，物品数量大，有些物品用户不一定会有接触产生评分，则所构成的矩阵存在许多零项； 
 数据噪音：用户评分时候很容易受到其他用户评分的影响，无法真实地反馈结果 
 冷启动问题：新物品入网时暂时未获得其他用户评分而无法产生推荐； 
 可扩展性差：复杂度为 O(m2n) ，m为用户数，n为物品数 
 为了解决这些问题（或者改善性能），文章提出了expert-KNN方法，主要思想是：用专家的评分来代替用户的评分。 
 数据稀疏：相同领域中的物品，专家的评分相对完善 
 数据噪音：专家的评分相对客观 
 冷启动问题：专家的评分是推荐系统外的数据，新物品入网时不会受到影响 
 可扩展性：复杂度为 O(m2n) ，专家数比用户数大幅减少
数据采集 
 user&item from Netflix 
 expert from Rotten Tomatoes 
 数据预处理： 
 通过采集观察到有些专家懒于对物品进行评分，这样的数据不会使我们的方法和user-KNN有太大的差别（在数据稀疏方面），所以要对这种数据进行剔除。 
 本文采用了设置一个阈值minimum ratings threshold  p