广告_广告中的流量预估实现思路

     在展示量合约广告中,流量预测[98]是一项支撑技术,它对于在线分配的效果至关重要。除此以外,在广告网络中,一般来说也需要根据定向条件和出价估计广告展示量,以辅助广告主进行决策。因此,流量预测是一项在计算广告中广泛使用的技术。


   流量预测的问题可以描述为:给定一组受众标签组合以及一个eCPM的阈值,估算在将来某个时间段内符合这些受众标签组合的条件并且市场价在该eCPM阈值以下的广告展示量。这里的eCPM阈值主要用于竞价广告系统中,目的是了解在某出价水平下的流量情形。对展示量合约式广告来说,这个阈值是不需要的,或者为了工程上一致,将该阈值设为一个很大的常数。


      流量预测一般的方法其实并不是预测,而是根据历史数据的统计来拟合未来的流量。当然,也可以引入时间序列分析的方法,从流量在时间轴上的规律预测未来某个时间段的流量,这主要适用于需要短时预测的场景,对广告业务来说不是很有必要。因此,我们将主要介绍根据历史数据统计的方法。用统计的方法解决流量预测问题,工程上的主要挑战在于,给定的受众标签组合可能性非常多,不可能将所有这些组合都预先做好统计。可行的思路是将其视为一个反向检索的问题:在一般的广告检索问题中,索引的文档是广告a,而查询是(u, c)上的标签;而在流量预测问题中,索引的文档由广告a变成了每次展示,而文档的内容即是这次展示上的(u, c)上的标签,而查询由(u, c)上的标签变成了广告设置的受众条件。可以看出,这两个问题是对偶的,可以用类似的技术方案来解决。
    与广告检索问题相比,流量预测的检索问题要简单一些:首先,(u, c)供给节点不存在布尔表达式描述,而是简单的特征集合;另外,流量预测的大多数应用场景对实时性的要求都不算高,例如,在竞价系统辅助决策时,秒级的响应完全可以满足要求,这比线上广告检索毫秒级的要求显然要低得多。用反向检索的方案来进行流量预测,主要有如下一些步骤。


(1)准备文档。

将历史流量中(u, c)上的所有标签的展示合并为一个供给节点i,并统计其总流量si,以及这部分流量上eCPM的直方图histi。这样的每个供给节点作为流量预测反向索引的一篇文档。


(2)建立索引。

对上一步生成的每个供给节点建立倒排索引,文档的关键词即为此供给节点(u, c)上的所有标签。同时,在索引的正排表部分记录下si和histi。


(3)查询结果。

对于一条输入的广告a,将其限定的标签条件作为查询,得到所有符合条件的供给节点的集合。


(4)估算流量。

遍历上一步得到的每个供给节点,对于某个供给节点i,首先计算其与该广告a的eCPM,即r(a, ui, ci) = µ(a, ui, ci)bida,然后根据相应的eCPM直方图histi计算a能获得的流量。这样,就可以估算出a在出价bida情形下能获得的近似流量。


      上述基于反向索引的流量预测方法如图12-3所示。在实际操作过程中,由于历史广告投放日志可能流量非常大,将所有的供给节点都建立索引在规模上是无法承受的。当然,实际上我们也并不需要这样做,在流量预测误差允许的范围内,我们可以在上面的第1步和第2步之间加一个采样的过程,将索引中的供给节点的数量控制在合理的规模。

 ===========================================

个人理解 :

Step1 . 数据抽样(大数据量的情况)

Step2 . 可以基于 ad_id(广告位) + 特征串 做预聚合

Step3. 构建ad_id 为索引的文档,将统计信息存储在es中

Step4. 某个条件下的预估就是按照 文档信息找doc 的过程

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值