推荐系统—论文笔记:Comparison of Collaborative Filtering Algorithms

一、 基本信息
论文题目:《Comparison of Collaborative Filtering Algorithms: Limitations of Current Techniques and Proposals for Scalable, High-Performance Recommender Systems》
发表时间:February 2011,ACM Transactions on the Web,Vol.5,No.1,Article 2
论文作者及单位:FIDEL CACHEDA,VICTOR CARNEIRO,DIEGO FERNANDEZ,VREIXO FORMOSO(University of A Coruna)
二、 摘要
比较了文献中不同的评估协同过滤算法的方法,使用最流行的度量和算法进行了实验,提出了两个旨在衡量优质物品精确度的新指标。论文提出了一种基于用户和项目之间的趋势或差异的解释的新方法,尽管简单,但是在实验中,它具有良好的结果。
三、 本文的工作及内容
文章结构如下:首先介绍了文中使用的符号,描述了现有技术,特别关注推荐系统的评估,给出了评估的算法以及在该评估中应用的度量,解释了所提出的基于趋势的算法。然后,引入两个新指标,用于衡量相关项目的算法精度。之后给出实验,并讨论了比较各种算法在不同情况下的行为结果。
A.介绍了基于内容过滤以及协同过滤下model-based和memory-based的优缺点。
B.评估存在的挑战和问题:
(1)确定了几种衡量算法质量的指标:
预测准确度,包括平均绝对误差(MAE)、均方误差(MSE)、均方根误差(RMSE)或归一化平均绝对误差。
分类准确度,precision,recall和ROC。
排名准确度,覆盖率等。
(2)如何进行评估:
离线评估,它基于以下方式进行了分析:训练子评估。训练子集是算法所知的数据,即算法用于计算推荐或评级预测的数据。然后将这些与评估子集中的数据进行比较。
(3)特定上下文中哪种算法最好:需要进行算法比较。
①Prediction Accuracy
在这里插入图片描述
②Root mean squared error (RMSE)
在这里插入图片描述
③Precision and recall
在这里插入图片描述
④Half-life utility
在这里插入图片描述
C.协同过滤算法
⑴the Pearson coefficient(皮尔逊系数)
在这里插入图片描述
⑵Constrained Pearson(受限制的皮尔逊)
在这里插入图片描述
⑶Vector similarity (Cosine)(矢量相似度(余弦))
在这里插入图片描述
⑷Mean squared difference(均方差)
在这里插入图片描述
⑸Weighted Pearson(加权皮尔逊)
在这里插入图片描述
在这里插入图片描述
D.提出两种新指标:良好项目MAE(GIM)和良好预测项目MAE(GPIM),它们分别计算预测好项目的MAE以及系统预测为好的项目。GPIM和GIM分别相当于精度和召回,但从预测精度的角度来看,它们结合了两者的优点,允许基于预测准确性任务的预测准确性进行评估,事实上,对GPIM与精确度之间相关性的研究显示出强烈的线性相关性。低GPIM值表示高精度。
E.在movielens数据集上对当前流形的不同推荐算法以及新提出的Tendencies-based算法进行了测试,并分析了结果。
对于MovieLens数据集和80%的训练集,六种最佳算法(UB,RSVD2,SVD ++,RSVD,SO和TB)的MAE差异没有统计学意义10,而10%,仅有三种最佳算法(RSVD2,SVD ++,TB)呈现相同的结果。使用Netflix数据集可以从结果中得出相同的结论。通过80%的训练集,最佳算法(RSVD,RSVD2,SVD ++,SO和TB)之间没有统计学上的显着差异,而10%时,SVD ++呈现最佳结果,其次是RSVD2,NSDV2,RSVD和TB。
四、 总结
本文就不同的协同过滤算法进行了种种比较,以观察不同情况下算法的行为,提出了离线评估的局限性,以确定建议的质量。本文提出了两种新的指标,即GPIM和GIM,它们侧重使用预测精度技术来测量推荐列表的质量。实验结果表明矩阵密度对于算法的精度有很大的影响,这种影响取决于算法的类型。本文也提出了将来的实验包括来自不同领域的新算法和其他数据集的研究方向,其中基于趋势的算法获得获得了良好的结果,也表明了未来工作的方向。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值