协同过滤–基于用户行为数据
(用户对物品产生的行为:比如评分,喜欢,购买等)
基于领域的算法
基于用户的协同过滤(UserCF)
笔记:针对用户U对物品i的感兴趣程度,先通过余弦相似计算出用户的相似度,取出相似程度最大的K个用户,在这K个用户中,找出对物品i有过行为的用户,将这些用户与用户U的相似度求和。
基于物品的协同过滤(ItemCF)
笔记:计算物品的相似度有很多方法,在隐语义模型中,利用ALS算法训练了一个模型,该模型可以对用户对物品的评分数进行预测(在电影推荐系统中),也可以找出物品的特征向量,然后利用余弦相似度来求物品的相似程度。
基于模型的算法(LFM隐语义模型)
笔记:在模型的求解中,参数是自己定义的,此时并不一定是最优解,可以求出预测数据与实际数据的均方根误差,找到最优的参数数值。
基于内容的推荐–针对物品的数据信息
基于标签(UDG)的推荐
-
尚硅谷:
-
书籍:
-
TF-IDF
笔记:对于新用户或者新物品,标签数量少,为了提高准确率,可以对标签进行扩展。
笔记:用户给物品打标签时,给用户推荐的标签是什么?
基于人口统计学–针对上下文信息
时间上下文信息(实时性)
包含时间信息的用户行为数据集由一系列三元组构成,其中每个三元组(u,i,t)代表了用户u在时刻t对物品i产生过行为。
时间上下文相关的ItemCF算法
时间上下文相关的UserCF算法