YouTubeDNN排序模型为什么预测的是观看时长?

引言

YouTubeDNN的排序模型在训练和推理阶段的目标是存在差异的,一个是输出加权LR,一个是输出幂,哪一个和宣称的用于预期观看时长都是不一致的,理论而言应该直接输出标量预测值比较合适。本文将尽量简单的介绍为什么这样做是合理的。

推导

推理阶段的输出是?

 首先我们知道LR的输出是:
p = 1 1 + e w x + b p=\frac{1}{1+e^{wx+b}} p=1+ewx+b1
代指了我们要预测的概率输出值,而根据数学推导有:
e w x + b = p 1 − p e^{wx+b}=\frac{p}{1-p} ewx+b=1pp
那么如果模型训练的足够好的话,那么推理阶段的输出应当为 p 1 − p \frac{p}{1-p} 1pp(标准称呼为 O d d s Odds Odds),也就是两个概率的比值,那么接下来只需要证明这两个概率的比值有观看时长的意义即可。

加权LR

 实际YouTubeDNN使用的weighted LR, 加权的意义是说当模型接收了正点击样本的输入时,输出 p p p是加权点击率而非普通的点击率。普通点击率计算公式为所有展示样本中,用户点击的频次:
p ′ = k N p'=\frac{k}{N} p=Nk
而加权点击率计算公式,总的观看时长除以分母,为:
p = ∑ i ∈ 点击 T i ∑ i ∈ 点击 T i + ( N − k ) p=\frac{\sum_{i\in 点击}T_i}{\sum_{i\in 点击}T_i+(N-k)} p=i点击Ti+(Nk)i点击Ti
令总观看时长为 T T T,那么化简可以得到:
p 1 − p = T N − k = T N ∗ 1 1 − k N = E ( T i ) 1 − p ′ \frac{p}{1-p}=\frac{T}{N-k}=\frac{T}{N}*\frac{1}{1-\frac{k}{N}}=\frac{E(T_i)}{1-p'} 1pp=NkT=NT1Nk1=1pE(Ti)
又用户点击的频次非常少,分母约等于0,所以 p 1 − p ≈ E ( T i ) \frac{p}{1-p}\approx E(T_i) 1ppE(Ti)
那么 e w x + b = E ( T i ) e^{wx+b}=E(T_i) ewx+b=E(Ti)

参考

经典推荐算法学习(十)| Youtube DNN serving目标解析 | 从odds到Logit 、Logistic Regression
揭开YouTube深度推荐系统模型Serving之谜

  • 23
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
YouTubeDNN是一个开源的项目,是基于Python语言和Django框架开发的YouTube风格的视频分享网站。以下是我对YouTubeDNN源码的理解和介绍: 首先,YouTubeDNN的源码主要分为前端和后端两部分。前端部分是使用HTML、CSS和JavaScript编写的,用于构建用户界面和实现交互功能。后端部分则是使用Python进行开发,并使用Django框架来处理网站的逻辑和数据管理。 在源码中,可以看到一些重要的功能模块,如用户认证和授权模块、视频上传和分享模块、用户评论和点赞模块等。这些模块通过不同的类和函数来实现相应的功能。此外,源码还包含了数据库模型定义、API接口设计以及网站路由配置等。 用户认证和授权模块是YouTubeDNN的核心功能之一。它通过用户注册、登录、密码重置等功能,实现用户的身份验证和访问权限控制。这些功能主要依赖于Django框架提供的用户认证系统,并通过与数据库的交互来保存和管理用户信息。 另一个重要的模块是视频上传和分享模块。在该模块中,用户可以上传视频,并对视频进行标签、描述等信息的编辑。上传完成后,视频将被保存到服务器上,并生成一个唯一的URL用于分享给其他用户。此外,还可以使用该模块实现视频的搜索、排序和分类展示等功能。 用户评论和点赞模块是YouTubeDNN的社交功能之一。用户可以在视频下面发表评论,并对其他用户的评论进行回复。同时,用户还可以给视频点赞或踩,以表达对视频的喜好和意见。 总的来说,YouTubeDNN的源码提供了一个基于Django框架的视频分享网站的开发基础。通过该源码,开发者可以学习和理解如何构建一个类似YouTube的网站,并可以根据实际需求进行二次开发和定制化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值