本文为阅读张任宇老师论文《Cold Start on Online Advertising Platforms: Data-Driven Algorithms and Field Experiments》的读书笔记。据张老师分享,该方法目前被应用到快手广告线上冷启动,取得了不错的收益。
问题背景
信息流广告冷启动面临的核心技术问题:
- 新广告数据量不足,其价值难以准确预估
- 合理分配广告流量,平衡消耗与冷启动价值
优化目标
找到合适的广告推送策略,最大化消耗与冷启动收益之和
符号说明
广告集合 A : { 1 , 2 , . . . , k } A:\{1,2,...,k\} A:{ 1,2,...,k}
转化出价 b : { b 1 , b 2 , . . . , b k } b:\{b_1,b_2,...,b_k\} b:{ b1,b2,...,bk}
y t , j y_{t,j} yt,j表示广告j是否被展现给用户t=1,2,3,…,T
x t = i x_t=i xt=i表示第t个用户的特征i
c i , j = c t r c_{i,j}=ctr ci,j=ctr 在特征i下广告j的实际点击率
c t , i , j ^ = p c t r \hat{c_{t,i,j}}=pctr ct,i,j^=pctr 用户t特征i下广告j的预估点击率
c v i , j = c t r ∗ c v r cv_{i,j}=ctr*cvr cvi,j=ctr∗cvr
c v t , i , j ^ = p c t r ∗ p c v r \hat{cv_{t,i,j}}=pctr*pcvr cvt,i,j^=pctr∗pcvr
β j \beta_j βj 表示冷启动时单次转化的价值(设为 2 b i 2b_i 2bi)
α T \alpha T αT 冷启动成功的阈值(设为10)
问题建模
m a x V ( y s , j ) = ∑ s ≤ t − 1 ∑ j ∈ A c v t , i , j ^ ∗ b j ∗ y s , j maxV(y_{s,j})=\sum_{s\leq t-1}\sum_{j\in A}\hat{cv_{t,i,j}}*b_j*y_{s,j} maxV(ys,j)=s≤t−1∑j∈A∑cvt,i,j^∗bj∗ys,j
+ ∑ j ∈ A β j ∗ m i n { ( ∑ s ∈ t − 1 c v t , i , j ^ ∗ y s , j ) , α ( t − 1 ) } +\sum_{j\in A}\beta_j * min\{(\sum_{s\in t-1}\hat{cv_{t,i,j}}*y_{s,j}),\alpha(t-1) \} +j∈A∑βj∗min{
(s∈t−1∑cvt,i,j^∗ys,j),α(t−1)}
其中第一项里面其实就是 p c t c v r ∗ c p a ∗ i s S h o w pctcvr*cpa*isShow pctcvr∗cpa∗isShow,也就是ecpm。
第二项是取当前转化数 ∑ s ∈ t − 1 c v t , i , j ^ ∗ y s , j \sum_{s\in t-1}\hat{cv_{t,i,j}}*y_{s,j} ∑s∈t−1cvt,i,j^∗