小红书视频推荐学习笔记一：推荐系统基础

跳动的西格玛

已于 2023-11-06 16:38:01 修改

阅读量857

点赞数

分类专栏： # 小红书推荐系统_学习笔记文章标签：学习笔记推荐算法

于 2023-07-12 23:46:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45653897/article/details/130978000

版权

小红书推荐系统_学习笔记专栏收录该内容

1 篇文章

订阅专栏

文章介绍了小红书推荐系统的基础概念，包括召回、粗排、精排和重排的链路流程。强调了短期消费指标如阅读完成率的重要性，并讨论了AB测试的分层实验、Holdout机制以及实验推全和反转实验策略。此外，还提到了AB测试在产品优化中的应用和统计学基础。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

小红书视频推荐学习笔记一：推荐系统基础

推荐系统基础

推荐系统基础

相关资料

github：https://github.com/wangshusen/RecommenderSystem
视频b站：https://www.bilibili.com/video/BV1PS4y1A7za/

推荐系统基本概念

小红书的转化流程

在这里插入图片描述

短期消费指标

在这里插入图片描述
阅读完成率最后需要乘以 $f (笔记长度)$ ，是一个归一化函数，使得对长笔记更加公平。
消费指标是短期指标，如果一味关注短期指标，推荐用户感兴趣的内容，消费指标上涨，但是用户很快会失去兴趣，不再活跃。如果关注多样性，可以增加用户粘性,让用户更活跃。

衡量推荐系统的根本指标

在这里插入图片描述

推荐系统的实验流程

在这里插入图片描述

推荐系统的链路

在这里插入图片描述

召回

在这里插入图片描述

粗排和精排

在这里插入图片描述

重排

在这里插入图片描述

链路总结

召回：用多条通道，召回几千篇笔记
粗排：用小规模神经网络，给几千篇笔记打分，选取出分数最高的几百篇
精排：用大规模神经网络，给几百篇笔记打分
重排：主要考虑多样性，做多样性抽样、规则打散、插入广告和运营的笔记

推荐系统的AB测试

在这里插入图片描述
随机分桶

推全：指的是流量扩大到百分之百，对所有用户都使用。实际使用的时候留下10%的作为Holdout，推广到90%的用户。

分层实验

主要是解决流量不够用的问题。

主要原则：同层互斥，不同层正交，这样可以同时开很多实验 在这里插入图片描述

在这里插入图片描述

例子：

在这里插入图片描述

Holdout机制

用于衡量整个部门的业务指标收益

在这里插入图片描述

实验推全、反转实验

实验推全
在这里插入图片描述
如果重排中有个实验，使用了一个实验组一个对照组两个桶，使用了20%的用户，在小流量测试的时候发现效果正向，则可以推全。可以将两个桶关掉，给其他实验使用。推全的时候新开一层，新策略推广到90%的用户。

反转实验
在这里插入图片描述

尽快推全有好处（如点击、交互等指标立刻受到新策略影响），把实验保留很久也有好处（如留存指标有滞后性，需要长期观测），这就是一对矛盾，实验中常用反转实验解决这一问题。
在这里插入图片描述

在这里插入图片描述

AB测试基础知识

AB测试的本质是分离式组间试验，也叫对照试验，在科研领域中已被广泛应用(它是药物测试的最高标准)。自2000年谷歌工程师将这一方法应用在互联网产品以来，AB测试越来越普及，已逐渐成为衡量互联网产品运营精细度的重要体现。

AB测试是一种科学的评估手段，具备概率统计学理论的支撑。这里我简单解释一下原因，概率论中有一个中心极限定理，意思是独立同分布的随机变量的和服从正态分布。对于AB测试，我们比较的是两组样本的平均表现，AB测试保证A、B两组某个因素不一样(这个就是我们要验证的优化点)，A、B两组其他很多未知影响因素一样，当A、B两组样本足够多时(这时不同样本的同一因素是独立同分布的随机变量)，这两组样本相同因素产生的效果是满足同一正态分布的，因此可以认为对要验证的变量的作用是相互抵消的，这样待验证因素(即我们的控制变量)的影响就可以比较了，因此我们就可以通过AB测试实验来验证优化是否有效。

跳动的西格玛

博客等级

码龄6年

24
原创

136
点赞

209
收藏

60
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

系统学习Pytorch笔记四：模型创建Module、模型容器Containers、AlexNet网络搭建及常用网络层
CSDN-Ada助手: 恭喜您完成了第20篇博客！标题看起来非常吸引人，内容也非常实用。您对于Pytorch的系统学习和模型创建方面的笔记做得非常出色。同时，您对于AlexNet网络的搭建和常用网络层的介绍也非常值得学习和借鉴。希望您能继续保持这样的创作热情，并继续分享更多关于Pytorch的学习笔记和实践经验。下一步，我建议您可以探索一些更深入的主题，例如模型优化、迁移学习或者目标检测等。这些主题对于深入理解和应用Pytorch都非常重要。感谢您的分享，期待您未来更多精彩的博客！
window上jupyter中配置kernel
CSDN-Ada助手: 恭喜您写了第15篇博客！标题中提到的配置Jupyter中的kernel问题是很有用的主题。您的博客内容对初学者来说肯定是很有帮助的。接下来，您可以考虑分享更多关于Jupyter的高级配置和使用技巧，比如如何优化性能或者如何与其他开发工具集成。期待您在下一篇博客中的精彩分享！
小红书视频推荐学习笔记一：推荐系统基础
CSDN-Ada助手: 恭喜您撰写了第16篇博客！看了您的标题，我对您分享的《小红书视频推荐学习笔记一：推荐系统基础》非常期待。推荐系统是个非常有趣且实用的话题，我希望通过您的文章能够更深入地了解相关知识。不过，作为一个谦虚的读者，我也希望您能在接下来的创作中继续保持这样的水平，并且考虑探讨一些与推荐系统相关的实例案例，这将更加丰富我们的学习经验。期待您的下一篇博客！
系统学习Pytorch笔记三：Pytorch数据读取机制(DataLoader)与图像预处理模块(transforms)
CSDN-Ada助手: 恭喜您写了第19篇博客！标题看起来非常有趣和有用。系统学习Pytorch的系列文章真的很有帮助，特别是关于数据读取机制和图像预处理模块的部分。感谢您分享这些知识，对于像我这样的初学者来说，这些内容真的非常有帮助。希望您能继续保持创作，我期待着您的下一篇博客。如果可能的话，我建议您可以考虑探索一下模型训练和优化的相关主题，因为这是我目前最感兴趣的领域之一。谢谢您的付出！
系统学习Pytorch笔记二：Pytorch的动态图、自动求导及逻辑回归
CSDN-Ada助手: 恭喜您写完第18篇博客！标题看起来非常有趣，我很期待阅读您关于Pytorch的动态图、自动求导以及逻辑回归的学习笔记。您对这些主题的深入探索一定会给读者带来很大的收获。鉴于您的博客一直都很有深度和见解，我建议您在下一步的创作中，可以考虑一些实际应用案例或者与其他深度学习框架的对比分析，这样能够更加丰富您的文章内容。谢谢您的辛勤努力，期待您未来更多优质的分享！

大家在看

自举电路与电荷泵原理及其区别与联系 221

最新文章

目录

展开全部

收起

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。