目录
2.1 T-Learner(Two model-差分响应模型)
一、背景
营销目标
在成本有限的情况下最大化营销的总产出,即最大化营销推广效率。关键挑战是找到最有可能被营销活动积极影响的用户,即营销敏感人群。
营销人群四象限
-
①Persuadables【说服型】:不营销就不转化、营销才会转化的人群,即营销敏感人群(目标客群);
-
②Sure things【确认型】:无论是否营销,都会转化,属于自然转化;
-
③Lost causes【沉睡型】:无论是否营销,都不转化,属于自然不转化;
-
④Sleeping dogs【勿扰型】:营销就不转化、不营销就转化的人群,即营销反感人群,对这类人群应极力避免触达。
Uplift Model 的落地价值在于“智能化营销”领域,用于衡量和预测营销干预带来的“增量提升”,把营销预算投入在Persuadables(营销敏感人群)用户上,不浪费在Sure things和Lost causes用户上,避免对Sleeping dogs用户产生反效果。
二、Uplift模型在智能营销中的价值
为了更好的理解response model和uplift model的差异,不妨看下面的例子:
有两类人群User1和User2,这两类人群相对广告的CVR分别为0.8%和0.2%。假如只有一次广告曝光的机会,应该像哪一类用户投放广告呢?(直觉会选择第二类)
用户 |
广告CVR |
无广告CVR |
Uplift |
人群匹配 |
User1 |
0.8% |
0.2% |
0.6% |
① |
User2 |
2.0% |
1.7% |
0.3% |
② |
User3 |
0.1% |
0.11% |
0.01% |
③ |
User4 |
0.9% |
0.1% |
-0.8% |
④ |
从上表不难看出,第一类用户的广告转换率较低,但在没有营销的情况下则更低,因此广告带来的增量(uplift)反而更高,从全局的视角我们要最大化总体的转化率等价于最大化广告带来的增量,按照这个逻辑我们应该像第一类用户投放广告。可以看出response model很可能会误导我们做出错误的决策,因此Uplift Model 和 Response Model 的差异主要在于两个模型的预测目标不一样。
-
Response Model 的目标是估计用户看过广告之后转化的概率,这本身是一个相关性,但这个相关性会导致我们没有办法区分出自然转化人群;
-
Uplift Model 是估计用户因为广告而购买的概率,这是一个因果推断的问题,帮助我们锁定对营销敏感的人群。
所以 Uplift Model 是整个智能营销中非常关键的技术,预知每个用户的营销敏感程度,从而帮助我们制定营销策略,促成整个营销的效用最大化。
即在营销活动中,我们要预测的是某种干预(treatment)带来的增量而构建的模型称为营销增益模型(uplift model),具体表示如下。设G表示模型的干预策略(如是否推送广告),X表示用户特征,Y=1表示用户输出的正向结果(如下单或点击)。
Response model:,看过广告后购买的概率,即预测干预后的个体状态或行为;
预测目标:
Uplift model: