广告点击延时反馈建模

这篇笔记探讨了在显示广告中如何处理转化的延迟反馈问题,提出了使用机器学习模型预测转化率和转化延迟时间。文章介绍了模型的构建,包括逻辑回归预测转化可能性和指数分布预测延迟时间,以及采用EM算法进行联合优化。该模型对于理解和优化CPA广告模式至关重要。
摘要由CSDN通过智能技术生成

论文Modeling Delayed Feedback in Display Advertising阅读笔记

Abstract

  1. 评估广告投放效果的重要指标:转化率(conversion rate) —– 在广告网站上采取行动的人占总浏览人数的比例。使用机器学习预估 conversion rate,从而预估收益。
  2. 然而conversion很可能延时发生,比如看过一个商品广告,当时有些心动但并没有马上去买,过了几天按捺不住又去购买(Delayed Feedback),给建模带来困难。
  3. 这篇文章提出概率模型,对未采取行动的客户进行判别:可能会买or不可能会买

Introduction

广告计费模式:参考学习: 网络广告中,CPC、CPA、CPM 的定义各是怎样的?

这篇文章集中在CPA(cost per action)模式,更确切的说,是post-click conversion(点击后转化,转化被归因到之前的点击)。只有产生了预先商定的行动才付费。支持CPA模式的平台,就需要将广告标价,转化为eCPM(期望CPM),取决于conversion rate。

转化的延迟反馈特性导致构件训练集,设置匹配窗口长度的困难:过短则漏掉部分conversion;过长则导致模型停滞。

本文生成训练集时,将样本标记为positive和unlabeled,需要从正例和未标记数据中进行学习,但都假定标记正例从正类中随机选择,标签缺失的概率恒定。但与本文所讨论的情形不同:点击刚发生时,标签最易缺失。

本文引入模型II捕捉点击和转化之间的期望延迟,这有点类似于survival time analysis(生存时间分析,指治疗开始和患者死亡之间的时间)。有一些时间是截断(conversion一直没有发生)的, 这表明延迟(或者生存)时间至少是那个截断时间。

然而病人终有一死,而客户却未必转化。这就需要两个模型:一个预测是否转化;另一个预测相应的延迟时间。这两个模型共同训练,共同分配结果。

数据来源:Criteo流量日志;营利模式:收益(CPC/CPA,广告商)- 成本(CPM,出版商)

Conversions

Post-Click Attribution

post-view attribution: 将转化归因于之前的一次或几次浏览
post-click attribution: 将转化归因于被点击的广告
本文转化时间窗口长度固定为:30天

匹配除了时间窗要求,还要有相同的用户id和广告商。在多次点击导致一次转化时,按照行业标准归因于最后一次点击。若有多次转化匹配一次点击,则只保留第一个。也就是说,本文不考虑,单次点击导致多次转化的情形。

Conversion Rate Prediction

eCPM=CPA×Pr(conversion,click) e C P M = C P A × P r ( c o n v e r s i o n , c l i c k )
          =CPA×Pr(click)×Pr(conversion|click)                     = C P A × P r ( c l i c k ) × P r ( c o n v e r s i o n | c l i c k )
条件概率分解能降低数据负载,并且在没有conversion时仍能提供一定的click信息。建模Pr(click)需要可扩展的模型:单一平台每日广告投放量可达数十亿,而点击反馈是即时的;建模Pr(conversion | click)规模较小,但有反馈延迟。

Analysis of the Conversion Delay

这里写图片描述

New Campaigns

广告展示的各个因素都在持续变化,当新的活动被加入系统时,原来训练好的模型效能将会降低:Keep the model fresh!
在图2中,新活动的比例持续增长,这预示着30天的长时间窗模型将受到影响。

Model

  • X X :特征集
  • Y { 0 , 1 } :转化是否已经发生
  • C{ 0,1} C ∈ { 0 , 1 } :用户是否终会转化
  • D D :点击和转化之间的延迟
  • E :点击后已经流逝的时间

Y=0C=0 or E<D Y = 0 ⟺ C = 0   o r   E < D
Y=1C=1 Y = 1 ⟹ C = 1
独立性假设: Pr(C,D|X,E)=Pr(C,D|X) P r ( C , D | X , E ) = P r ( C , D | X )
也就是说,在这个模型中,不根据已经过了多久来判断转化最终是否发生和最终延迟时间。

给定数据集: (xi,yi,ei) ( x i , y i , e i ) ,如果 yi=1

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 6
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值