推荐系统入门必读的经典paper

推荐系统入门必读的经典paper

(2016-12-15 21:33:25)
 分类:数据挖掘

CollaborativeFiltering主要包含两个分支,最早是Memory based(包括user-based和item-based),netflix2006年的竞赛之后发展出来 一系列基于矩阵分解Matrix Factorization的协同过滤算法,统称为Model basedCF。

1. Memory based CF


2. Model based CF

2.0 Simon Funk SVD

  • Netflixupdate: try this at home, 2006
    用SGD做矩阵分解的鼻祖,传统矩阵奇异值分解方法在大数据集上会有严重的计算效率问题。

2.1 Koren的paper

  • Matrix factorization techniques for recommender systems, IEEEComputer Society, 2009
    Yehuda Koren的文章,Koren是netflix竞赛的获胜者。里边算法原理、来龙去脉讲的非常清楚,MF入门必读的经典综述性paper。顺着paper里的reference基本上可以理清Koren所有工作的分支。
  • Collaborative filtering for implicit feedback datasets, ICDM2008
    讲MF如何应用在隐式反馈的数据集上。现实工业界中大部分数据都是隐式反馈(点击/购买等),而不是netflix和movieLens那种评分数据。
  • Factorization meets the neighborhood: a multifaceted collaborativefiltering model), KDD 2008
    讲MF和neighborhood方法如何结合,即用Model的方法去学item的相似矩阵。SVD++就出自这篇文章,反正就是在目标函数里加各种信息和各种bias,你用了额外的信息嘛,如果使用得当效果肯定会更好,大规模工业界应用会有计算效率问题。
    还有更早的一篇: Scalable collaborative filtering with jointly derivedneighborhood interpolation weights,发在ICDM 2007,我没看过。
  • Improving RegularizedSingular Value Decomposition for Collaborative Filtering, A.Paterek, KDD cup 2007.
    这篇不是Koren的文章,但是SVD++里,固定user矩阵,学两个item latentfactor矩阵的思路应该是从这篇paper里来的。

2.2 Rendle的paper

2.3 SLIM && GeorgeKarypis的paper

SLIM的一系列paper都是George的学生搞的

  • Slim: Sparse linear methods for top-n recommender systems, ICDM2011
    SLIM可以看成了MF的一种特例,user用原始的item空间,而item学一个aggregationcoefficients矩阵,即每个item学一个用其他item的线性组合表征。这个方法更贴近业界的实际应用,因为学到的W是非常稀疏的一个矩阵,而且是非负的,这样在生成top-n推荐候选集的时候计算是很快的。

  • Sparse linear methods with side information for top-nrecommendations, RecSys 2012.
    SLIM如何结合side information一起做优化.

  • Fism: factored item similarity models for top-n recommendersystems, KDD 2013
    作者也是George的学生,思路源于Paterek KDD cup 07那篇NSVD和SLIM结合,去学两个item的latentfactormatrix。和NSVD最大不一样的地方就是约束了对角线=0,也就是说在做分解的时候不用item本身去还原他自己,同时加了L1norm。学出来的是稠密矩阵,而且去掉了SLIM中W>0的限制,评测上HR(HitRate)要好于SLIM和其他方法,而且好不少。但是同样,大规模应用又会遇到计算效率的问题。(这不又回去了么...)

  • Hoslim_Higher-order_sparse_linear_method,PAKDD 2014
    细节还没看,估计就是在目标函数上做一些改动什么的又发了一篇。

3. 其他

                                                                                      by runnery,梳理于2016.12.15

转载请注明出处!!
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值