一、介绍
SLIM模型是明尼苏达大学2011年的论文,点击打开链接这是文章链接。GLSLIM是今年推荐系统顶会RecSys的 best paper,新鲜出炉Local Item-Item Models for Top-N Recommendation 。网上还没有解释过SLIM的博文,所以写在这里(全网首发哦,转载请注明出处),希望和大家分享,如果有错误的地方,也希望大家批评建议。
Top-N 推荐系统一直是热门问题,它的解决算法一般分为两大类:neighborhood-based 和 model-based。 neighborhood-based 大家都很熟悉,用各种距离度量方式计算出用户之间(user-based)或者物品之间(item-based)的近似度,然后类似于KNN算法,根据该用户(物品)的最相似的 k 个用户(物品)来进行推荐,这种算法只用了用户行为数据,可解释性强,容易实现,得益于用户行为矩阵的稀疏性,运算非常快。Youtube之前的视频推荐算法,是content-based和item-based结合,根据用户行为,只计算同一topic下的视频的相似度,这样避免了用户行为数据里的噪音,并且相对普通的item-based算法,更好地利用了长尾数据,增强了推荐系统的覆盖率,并且在改进算法中结合model-based,效果进一步提升。Model-based一般是指根据用户行为数据矩阵进行矩阵分解或者用模型来学习用户、物品隐变量,用学习到的低rank的用户矩阵、物品矩阵相乘来预测结果,典型算法有SVD, SVD++, ALS算法等等。 Neighborhood-based的优势是计算速度快(毕竟不需要有训练、学习的过程),但是速度是牺牲在推荐效果上的。Model-based算法推荐效果会优于neighborhood-based算法,但是推荐效果的提升是在算法训练时间大幅上涨的前提下。那么,有没有一种算法可以既提升neighborhood-based算法的效果,又提升model-based算法的运行时间呢?答案就是SLIM算法。