（8）工业界推荐系统-小红书推荐场景及内部实践【冷启动问题2】

NLP_wendi

已于 2022-06-11 18:02:39 修改

阅读量2k

点赞数 3

分类专栏：推荐系统深度学习文章标签：推荐算法

于 2022-06-05 23:04:03 首次发布

本文链接：https://blog.csdn.net/qq_32275289/article/details/125137559

版权

32 篇文章

订阅专栏

15 篇文章

订阅专栏

系列文章传送门

该系列文章根据小红书搜推算法工程师、团队负责人王树森B站上主讲的《工业界的推荐系统》之小红书业务场景及内部实践整理而得。感谢大佬分享工业界前沿的推荐系统实战技术！

这篇文章讲解工业界推荐系统实践中对于冷启动问题的处理技巧，包括：冷启动评价指标、召回通道、聚类召回、Lookalike人群扩展、流量调控以及冷启动中的AB测试等。

Lookalike 人群扩散

Look-Alike起源于互联网广告

在这里插入图片描述

Look-Alike人群扩散召回

冷启动的优化点

扶持新笔记的目的

工业界的做法

流量调控技术的发展

在这里插入图片描述

保量的难点

保量成功率远低于 100%。
- 很多笔记在24小时达不到100次曝光。
- 召回、排序存在不足。
- 提权系数调得不好。
线上环境变化会导致保量失败
- 线上环境变化:新增召回通道、升级排序模型、改变重排打散规则…
- 线上环境变化后，需要调整提权系数。
思考题
- 给所有新笔记一个很大的提权系数(比如 4 倍)，直到达成 100 次曝光为止。
- 这样的保量成功率很高。
- 为什么不用这种方法呢?
给新笔记分数 boost 越多，对新笔记越有利?
- 好处:分数提升越多，曝光次数越多。
- 坏处:把笔记推荐给不太合适的受众。
  - 点击率、点赞率等指标会偏低。
  - 长期会受推荐系统打压，难以成长为热门笔记。

保量：不论新笔记质量高低，都做扶持，在前 24 小时给 100 次曝光。
差异化保量：不同笔记有不同保量目标，普通笔记保 100 次曝光，内容优质的笔记保 100~500 次曝光。
- 基础保量：24 小时 100 次曝光。
- 内容质量：用模型评价内容质量高低，给予额外保量目标，上限是加 200 次曝光。
- 作者质量：根据作者历史上的笔记质量，给予额外保量目标，上限是加 200 次曝光。
- 一篇笔记最少有 100 次保量，最多有 500 次保量。