【阅读笔记】快手OCPX广告冷启动影子价格法

本文介绍了如何应用影子价格法解决在线广告平台冷启动问题,通过最大化消耗与冷启动收益之和,利用次梯度下降法求解对偶问题,实现实时广告策略优化。实验表明,此方法能显著提高冷启动成功率和价值。
摘要由CSDN通过智能技术生成

本文为阅读张任宇老师论文《Cold Start on Online Advertising Platforms: Data-Driven Algorithms and Field Experiments》的读书笔记。据张老师分享,该方法目前被应用到快手广告线上冷启动,取得了不错的收益。

问题背景

信息流广告冷启动面临的核心技术问题:

  1. 新广告数据量不足,其价值难以准确预估
  2. 合理分配广告流量,平衡消耗与冷启动价值
优化目标

找到合适的广告推送策略,最大化消耗与冷启动收益之和

符号说明

广告集合 A : { 1 , 2 , . . . , k } A:\{1,2,...,k\} A:{ 1,2,...,k}

转化出价 b : { b 1 , b 2 , . . . , b k } b:\{b_1,b_2,...,b_k\} b:{ b1,b2,...,bk}

y t , j y_{t,j} yt,j表示广告j是否被展现给用户t=1,2,3,…,T

x t = i x_t=i xt=i表示第t个用户的特征i

c i , j = c t r c_{i,j}=ctr ci,j=ctr 在特征i下广告j的实际点击率

c t , i , j ^ = p c t r \hat{c_{t,i,j}}=pctr ct,i,j^=pctr 用户t特征i下广告j的预估点击率

c v i , j = c t r ∗ c v r cv_{i,j}=ctr*cvr cvi,j=ctrcvr

c v t , i , j ^ = p c t r ∗ p c v r \hat{cv_{t,i,j}}=pctr*pcvr cvt,i,j^=pctrpcvr

β j \beta_j βj 表示冷启动时单次转化的价值(设为 2 b i 2b_i 2bi)

α T \alpha T αT 冷启动成功的阈值(设为10)

问题建模

m a x V ( y s , j ) = ∑ s ≤ t − 1 ∑ j ∈ A c v t , i , j ^ ∗ b j ∗ y s , j maxV(y_{s,j})=\sum_{s\leq t-1}\sum_{j\in A}\hat{cv_{t,i,j}}*b_j*y_{s,j} maxV(ys,j)=st1jAcvt,i,j^bjys,j
+ ∑ j ∈ A β j ∗ m i n { ( ∑ s ∈ t − 1 c v t , i , j ^ ∗ y s , j ) , α ( t − 1 ) } +\sum_{j\in A}\beta_j * min\{(\sum_{s\in t-1}\hat{cv_{t,i,j}}*y_{s,j}),\alpha(t-1) \} +jAβjmin{ (st1cvt,i,j^ys,j),α(t1)}

其中第一项里面其实就是 p c t c v r ∗ c p a ∗ i s S h o w pctcvr*cpa*isShow pctcvrcpaisShow,也就是ecpm。

第二项是取当前转化数 ∑ s ∈ t − 1 c v t , i , j ^ ∗ y s , j \sum_{s\in t-1}\hat{cv_{t,i,j}}*y_{s,j} st1cvt,i,j^

冷启动描述了在线广告平台中普遍公认的挑战:由于数据有限,机器学习系统无准确估计新广告的点击率 (CTR) 和转化率 (CVR),进而无对这些新广告进行有效定价或与平台用户匹配。 新广告冷启动不成功会促使广告主离开平台,降低广告市场的厚度。 为了解决在线广告平台的冷启动问题,我们构建了一个数据驱动的优化模型,以捕捉短期收入和广告的长期市场厚度之间的基本权衡。 基于对偶理论和老虎机算法,我们开发了带有可证明后悔上限的 O(T^{2/3}K^{1/3}(logT)^{1/3) 的影子竞价学习 (SBL) 算法}d^{1/2}),其中 K 是广告数量,d 是底层机器学习预言机用于预测 CTR 和 CVR 的有效维度。 此外,我们提出的算法可以在实践中直接实现,对真实的在线广告系统进行最少的调整。 为了证明我们的冷启动算法的实用性,我们与一个大型在线视频共享平台合作,在线实现了该算法。 在这种情况下,传统的单边实验会导致估计有很大偏差。 因此,我们进行了一项新的双边随机现场实验,并设计了无偏估计来检查 SBL 算法的有效性。 我们的实验结果表明,所提出的算法可以使冷启动成功率大幅提高 61.62%,而短期收益仅降低 0.717%,从而使总目标值提高 0.147%。 我们的研究弥合了强盗算法理论与广告冷启动实践之间的差距,并突出了精心设计的冷启动算法对在线广告平台的重要价值。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值