基于用户行为
Content Based
基于内容本身特征
- 前提:Item - 特征, 用户 - items (喜爱程度)
- 推导:用户 - 特征(喜爱程度)
- 结果:用户 - 未知 item (喜爱程度)
User Collaborative Filtering
相似用户喜欢的内容
- 前提:用户 - items (喜爱程度)
- 推导:用户相似度
- 结果:用户 - 未知 item (喜爱程度)
Item Collaborative Filtering
用户喜欢内容的相似内容
- 前提:用户 - items (喜爱程度)
- 推导:同时喜欢两个物品的用户数 → 物品相似度
- 结果:用户 - 未知 item (喜爱程度)
方法 | 说明 | 适用范围 | 特点 | 适用场景 |
---|---|---|---|---|
CB | 基于内容本身特征 | |||
ItemCF | 基于用户对内容评分 | 用户数>>Item数 | 系统多样性,长尾,个性化 | 购物网站、技术博客 |
UserCF | 基于用户组 | Item数>>用户数 | 单用户多样性,热门,社会化 | 新闻、短视频 |
基于标签
标注方法
- 用户打标、运营打标、系统打标
标签分类
- 内容、类别、创作者、品质、难度、组织 ……
推导过程
- 前提:用户-内容(喜爱程度)、内容-标签
- 推导:用户-标签
- 结论:用户-未知内容(喜爱程度)
基于上下文
时间
用户的偏好迁移(短期偏好、长期偏好) —— User CF、Item CF 都可以加入时间衰减函数
内容的生命周期
季节效应
节日选择
地域和热度
新闻、酒店推荐 ……
基于点击率预估
这三种传统推荐算法局限性:不适用于亿级数据、协同矩阵稀疏、无法达到秒级实时性
一般推荐系统架构图: