- 笔记摘自王树森老师的推荐系统公开课:基于小红书的场景讲解工业界真实的推荐系统
- 评论区有位同学分享了该课程的详细笔记,可供参考:笔记-工业界的推荐系统
- 写博客主要是记录自己认为重要的或没完全掌握的知识点
推荐系统的链路
- 召回:快速取回用户可能感兴趣的物品。在小红书场景下,⽤多条通道,取回⼏千篇笔记。
- 多条召回通道取回的物品进行融合,去重,并过滤(例如去掉用户不喜欢的作者或话题)。
- 召回通道包括协同过滤、双塔模型、关注的作者等。
- 粗排:⽤⼩规模神经⽹络,给⼏千篇笔记打分,选出分数最⾼的⼏百篇。
- 精排:⽤⼤规模神经⽹络,给⼏百篇笔记打分。
- 重排:做多样性抽样、规则打散、插⼊广告和运营笔记。
A/B测试
-
分层实验:同层互斥(不允许两个实验同时影响⼀位⽤户)、不同层正交(实验有重叠的⽤户)。
-
Holdout:保留 10% 的⽤户,完全不受实验影响,可以考察整个部门对业务指标的贡献。
-
实验推全:新建⼀个推全层,与其他层正交。
-
反转实验:在新的推全层上,保留⼀个⼩的反转桶,使⽤旧策略。长期观测新旧策略的 diff。