目录
注:北大刘宏志老师的《推荐系统》课程学习,图片来源于课程PPT和参考书籍
1、协同过滤的缺陷
-
依赖用户和项目的交互行为数据挖掘;
-
项目冷启动,短视频、新闻资讯等频繁产生新的项目的,新项目不存在用户和项目交互;
-
数据稀疏,不活跃用户(反馈行为较少的用户)存在很少的交互行为;
2、基于内容的推荐算法思想
-
推荐用户过去感兴趣的项目内容相似项目;
-
推荐用户过去感兴趣项目的特性类似的项目;
可以解决项目冷启动问题、数据稀疏问题。
3、算法步骤
(1)项目建模:项目的结构化特征
(2)用户建模:根据用户历史行为和相关项目信息,刻画用户的偏好特征
(3)生成推荐列表:根据项目特征和用户偏好特征的匹配程度对项目进行排序
图3.1 基于内容的推荐算法框图
4、产生推荐的算法
包括基于记忆的预测和基于模型的预测
4.1、基于记忆的预测
基于记忆的预测包括两种:TOP-N和评分预测
主要难点在于求项目之间相似度的算法,后面的文章会详细介绍。
图4.1 基于记忆的产生推荐算法步骤