在任何读到推荐系统的地方,你都会发现一种分类方法:基于记忆的推荐系统与基于模型的推荐系统。看到一些对此分类的糟糕解释,我决定尝试尽量简略的解释它。
基于记忆的方法使用用户之间(协同过滤)或物品之间(基于内容的推荐)的联系(相似性)这一数据(赞、投票、点击等等)来给用户u推荐他从来没见到的物品i。在协同过滤例子中,从与用户u最相似的用户组里的物品集来推荐,因此物品是协同合作的。与此相反,基于内容的推荐尝试比较物品的特性如电影类型、演员、原书的出版社等来推荐相似的新物品。简单地说,基于记忆的方法严重地依赖简单的相似性度量(比如余弦相似性、皮尔森相关系数等)来把相似的用户或物品匹配起来。如果有一矩阵,其中每一行是一个用户,每一列代表一个物品,则基于记忆的方法对这一矩阵的行或列使用相似性度量来获得一个相似度值。
另一方面基于模型的方法尝试更进一步地填充上面说的矩阵,它们尝试量化一个用户会多么的喜欢他们之前没有遇到的物品。为达此目的,基于模型的方法使用一些机器学习算法来对物品的向量(针对一个特定的用户)来训练,然后建立模型来预测用户对于新的物品的得分。流行的基于模型的技术是贝叶斯网络、奇异值分解和隐含概率语义分析。
原文链接: