负样本修正:CVR预估时间延迟问题

你的标签错了,而且错了很多!

v2-071e132c7353c2be34deb925be1bf617_b.jpg
一元@炼丹笔记

在推荐搜索的建模中,我们经常会使用D+1天的数据作为label,从1~D天的数据中的进行特征抽取等工作,和我们时间序列问题建模类似,但和很多其他的时间序列问题建模不一样的地方在于,我们的label不一定可靠,比如在传统的时间序列回归中,D+1天的销量是多少就是多少,我们没有太多的犹豫,因为不大会有其他的情况。但是在电商的问题中,就存在下面这种情况:

D+1天未购买可能并不一定是真正意义上的未购买,而可能是加入购物车或者意愿清单了, 只是没有在当天下单, 而是过了一天在D+2天的时候下了单, 而这样的标签如果我们直接默认其为负样本就会有较大的问题,因为它并不是真正意义上的负样本,只是反馈延迟了。

这在搜索推荐系统中,我们称之为延迟反馈的问题。

v2-c20ec388e6e3604bfbcc35ebc145d86e_b.jpg

那么这个问题严重吗?如果只有1%不到的数据在第二天甚至之后出现了延迟,那么或许并不是一个问题,但实际呢?在Criteo公司早期,

  • 有35%的商品会在点击后一个小时内得到转化;
  • 有50%的商品会在点击后24h内得到转化;
  • 有13%的商品会在点击后2周之后才得到转化。

v2-4c46704aec3479ef91d39c004281d250_b.jpg

那么如何解决该问题呢?

对时间延迟建模

这个问题较早在2014文章Modelling Delayed Feedback in Display Advertising中被提出,该文十分经典,同时提出的问题十分具有实践价值,但是已经过去了6年, 本文我们就研讨最新的IJCAI20关于CVR预估标签延迟的paper.《An Attention-based Model for CVR with Delayed Feedback via Post-Click Calibration》。

最新延迟反馈论文解读

问题背景

在早期对于标签反馈延迟的建模都是建立在LR等传统模型上,会存在模型表示能力欠缺以及需要大量人工专家特征的问题,本文将传统的模型替换为现在火热的深度学习模型,从而大大提高模型的表示能力。

但是在深度模型用于推荐问题时,又会出现大量类别特征EMbedding的稀疏性问题,这在CTR建模的时候是很容易得到解决的,因为CTR数据集是非常大的,模型往往可以学习到不错的Embedding信息,但是CVR的数据集是相对较小的。

所以如何解决数据稀疏性的问题是一个非常大的挑战;

此外,早期的文章都假设,也就是说,用户在点击商品之后到现在的时间是不影响我们商品的最终转化以及转化时间,这其实是不对的。

很明显地,用户在点击完某个商品之后对于其他商品的点击会影响最终是否会购买该商品?

以及最终购买该商品的时间(本文做了一定泛化,依然假设点击item之后到目前的时间不会影响最终商品是否会转化,但是会影响商品最终转化的时间)。

所以本篇文章就是Focus在解决数据稀疏性以及标签延迟反馈的问题上提出了一种新的解决方案。

下面我们看看本文是如何来解决这两大挑战的。数据稀疏性问题&时间延迟建模

模型部分

数据稀疏性问题

为了处理因为数据样本量稀少而带来的大量ID特征学习不充分的问题,本文使用预训练好的Telepath从Item的图像中学习得到结果替换稀疏的ID特征,以此来缓解该问题。从文章最后的实验中我们也发现,数据稀疏性带来的影响是巨大的,具体地可以参见实验部分。

转化模型&时间延迟模型

在稀疏ID的Embedding处理完成之后,接下来我们看一下我们的模型框架,

v2-b72383dad72aa96c37d9cfc1521c038e_b.jpg

本文的模型框架主要分为左右两个模块,左侧的转化模型以及右侧的时间延迟模型。

1.左侧转化模型

v2-22776a453c7edd1f9f3d0e4c111a948a_b.jpg

我们可以用自己设计的网络结构来构建自己的转化模型. 本文的转化模型的构建主要有三个模块,我们由后往前看,

v2-29fb7bead1cc1e0bc1634de98d87d9b0_b.jpg

2.时间延迟模型

2.1 关系梳理

和《Modeling Delayed Feedback in Display Advertising》论文中类似,我们还需要得到

v2-a4813e46a1341871aa8b1a14be87c019_b.jpg

我们将转换的延迟时间全部转化为天的粒度, 在Survival Analysis中我们知道, 只要得到其中任意一个的表示,就可以得到其他的表示,也就是说我们对f(t)或者s(t)进行假设之后,就可以推导得到f(t),h(t)以及s(t)三者的表示.

v2-2c37b9e1a3dfa9904ca8109adbe30151_b.jpg

2.2 网络表示

那么接下来我们只需要看一下该概率是如何通过网络层进行表示的,具体可以参考文章给出的右侧的网络大致框架进行解读。和之前的一样,我们由后往前看,

v2-f1365086afe33aae6c941b6006d54b4e_b.jpg

实验结果

1.整体性能比较

我们看一下本文的实验结果,

v2-ed991de3808540bccc05c354d31a2ea3_b.jpg

从上面的实验中,我们发现:

    • Item的Embedding初始化对效果的影响是巨大的;
    • Time Delay模块的影响仅次于Item的Embedding初始化;
    • SelfAttention的影响是WP1和JD-MP数据集上的影响是相对较小的。

2.Time Delay分析:

v2-de69016d404be1bd4ba83467ac7a592b_b.jpg

我们从Figure2中可以看到,我们的在训练集和测试集上的时间延迟分布是类似的,此处我们用Jensen-Shannon divergence来刻画不同模型对于time delay的预测,而从结果上看,本文的算法对于时间延迟的预测也是最好的。

v2-071e132c7353c2be34deb925be1bf617_b.jpg
一本有仙气的笔记,记录了AI里的不凡

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值