youtube推荐系统paper中关于weighted LR和以odds做为输出的思考

个人思考

  • paper:Deep Neural Networks for YouTube Recommendations - 2016

  • 关于其中ranking model以weighted LR进行训练和直接将 e w x e^{wx} ewx做为时长预估输出。这里疑惑了很久,记录下自己的理解。

  • 首先定义一个“观看时长率”的概念:
    p ~ = ∑ T i ∑ T i + n n e g = ∑ T i N ~ (1) \widetilde{p}=\frac{\sum{T_i}}{\sum{T_i} + n_{neg}} =\frac{\sum{T_i}}{\widetilde{N}} \tag{1} p =Ti+nnegTi=N Ti(1)
    本质上这个weighted LR学的是 p ~ \widetilde{p} p ,应该是一个“观看时长率”这么一个概念,注意这里的 N ~ \widetilde{N} N 其实是 ∑ T i + n n e g \sum{T_i} + n_{neg} Ti+nneg,即加权样本和,而不是原始的样本数n,这里有一点绕。

  • 从逻辑回归定义来讲,需要学习odds,定义odds:
    o d d s = ∑ T i n n e g = ∑ T i N ~ − ∑ T i = ∑ T i N ~ 1 − ∑ T i N ~ = p ~ 1 − p ~ (2) odds=\frac{\sum{T_i}}{n_{neg}} =\frac{\sum{T_i}}{\widetilde{N}-\sum{T_i}} =\frac{\frac{\sum{T_i}}{\widetilde{N}}}{1-\frac{\sum{T_i}}{\widetilde{N}}} =\frac{\widetilde{p}}{1-\widetilde{p}} \tag{2} odds=nnegTi=N TiTi=1N TiN Ti=1p p (2)

  • 对odds进行转换:
    o d d s = ∑ T i n n e g = ∑ T i n − n p o s = ∑ T i n n − n p o s n = E [ T ] 1 − p (3) odds=\frac{\sum{T_i}}{n_{neg}} =\frac{\sum{T_i}}{n-n_{pos}} =\frac{\frac{\sum{T_i}}{n}}{\frac{n-n_{pos}}{n}} =\frac{E[T]}{1-p} \tag{3} odds=nnegTi=nnposTi=nnnposnTi=1pE[T](3)
    这里其实是对学的odds公式做了一个转换, n n e g = n − n p o s n_{neg} = n - n_{pos} nneg=nnpos,才有后续的计算。p是播放率。

  • 对odds进行近似:
    o d d s = E [ T ] 1 − p ≈ E [ T ] ( 1 + p ) ≈ E [ T ] , ( p < < 1 ) (4) odds= \frac{E[T]}{1-p} \approx E[T](1+p) \approx E[T],(p<<1) \tag{4} odds=1pE[T]E[T](1+p)E[T],(p<<1)(4)

  • 跟宋博聊了下,这个地方的近似就是一个Taylor展开:
    o d d s = E [ T ] 1 − p = E [ T ] ∗ 1 1 − p = E [ T ] ∗ ( 1 + p + p 2 + . . . ) ≈ E [ T ] , ( p < < 1 ) odds =\frac{E[T]}{1-p} =E[T]*\frac{1}{1-p} =E[T]*(1+p+p^2+...) \approx E[T],(p<<1) odds=1pE[T]=E[T]1p1=E[T](1+p+p2+...)E[T],(p<<1)

  • 最后近似这个地方,paper是这个思路吗?感觉没有必要走 E [ T ] ( 1 + p ) E[T](1+p) E[T](1+p)这一步近似,前面除法那个公式在 p < < 1 p<<1 p<<1的时候照样可以进行近似的。

  • 总体来讲,这个方法虽然真的很让人耳目一新,但 p < < 1 p<<1 p<<1这个假设太粗暴了吧,youtube App的视频播放率,起码得有20%?终究还是有一点强行近似的意思。

欢迎讨论指教。

参考

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值