小红书视频推荐学习笔记一:推荐系统基础

推荐系统基础

相关资料

github:https://github.com/wangshusen/RecommenderSystem
视频b站:https://www.bilibili.com/video/BV1PS4y1A7za/

推荐系统基本概念

小红书的转化流程

在这里插入图片描述

短期消费指标

在这里插入图片描述
阅读完成率最后需要乘以 f ( 笔记长度 ) f(笔记长度) f(笔记长度),是一个归一化函数,使得对长笔记更加公平。
消费指标是短期指标,如果一味关注短期指标,推荐用户感兴趣的内容,消费指标上涨,但是用户很快会失去兴趣,不再活跃。如果关注多样性,可以增加用户粘性,让用户更活跃。

衡量推荐系统的根本指标

在这里插入图片描述

推荐系统的实验流程

在这里插入图片描述

推荐系统的链路

在这里插入图片描述

召回

在这里插入图片描述

粗排和精排

在这里插入图片描述

重排

在这里插入图片描述

链路总结

  • 召回:用多条通道,召回几千篇笔记
  • 粗排:用小规模神经网络,给几千篇笔记打分,选取出分数最高的几百篇
  • 精排:用大规模神经网络,给几百篇笔记打分
  • 重排:主要考虑多样性,做多样性抽样、规则打散、插入广告和运营的笔记

推荐系统的AB测试

在这里插入图片描述
随机分桶
在这里插入图片描述
在这里插入图片描述

推全:指的是流量扩大到百分之百,对所有用户都使用。实际使用的时候留下10%的作为Holdout,推广到90%的用户。

分层实验

主要是解决流量不够用的问题。

主要原则:同层互斥,不同层正交,这样可以同时开很多实验在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
例子:
在这里插入图片描述

在这里插入图片描述

Holdout机制

用于衡量整个部门的业务指标收益

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

实验推全、反转实验

实验推全
在这里插入图片描述
如果重排中有个实验,使用了一个实验组一个对照组两个桶,使用了20%的用户,在小流量测试的时候发现效果正向,则可以推全。可以将两个桶关掉,给其他实验使用。推全的时候新开一层,新策略推广到90%的用户。

反转实验
在这里插入图片描述

尽快推全有好处(如点击、交互等指标立刻受到新策略影响),把实验保留很久也有好处(如留存指标有滞后性,需要长期观测),这就是一对矛盾,实验中常用反转实验解决这一问题。
在这里插入图片描述

在这里插入图片描述

AB测试基础知识

AB测试的本质是分离式组间试验,也叫对照试验,在科研领域中已被广泛应用(它是药物测试的最高标准)。自2000年谷歌工程师将这一方法应用在互联网产品以来,AB测试越来越普及,已逐渐成为衡量互联网产品运营精细度的重要体现。

AB测试是一种科学的评估手段,具备概率统计学理论的支撑。这里我简单解释一下原因,概率论中有一个中心极限定理,意思是独立同分布的随机变量的和服从正态分布。对于AB测试,我们比较的是两组样本的平均表现,AB测试保证A、B两组某个因素不一样(这个就是我们要验证的优化点),A、B两组其他很多未知影响因素一样,当A、B两组样本足够多时(这时不同样本的同一因素是独立同分布的随机变量),这两组样本相同因素产生的效果是满足同一正态分布的,因此可以认为对要验证的变量的作用是相互抵消的,这样待验证因素(即我们的控制变量)的影响就可以比较了,因此我们就可以通过AB测试实验来验证优化是否有效。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值