文献阅读:Entire Space Multi-Task Model:An Effective Approach for Estimating Post-Click Conversion Rate

文献链接:https://arxiv.org/pdf/1804.07931.pdf

1. 内容简介 & 问题描述

这是阿里在18年给出的一篇仅仅只有4页的工程论文,不过影响却挺大的。

其针对的问题在于cvr数据的稀疏性以及由于数据稀疏性导致的SSB问题(sample selection bias)。

具体而言,这里考察的主要是电商场景下的cvr(click conversion rate)问题,即点击到购买之间的转化率。

但是,这里主要的问题在于,用户的点击行为只占据曝光商品的极小一部分,且大量聚集在热门商品当中,而其中最终转化为购买行为的数据更是只占据其中的极小一部分,因此,这就导致最终模型使用时的作用数据域(曝光数据域)与其在训练时使用的数据域(点击商品域)之间存在较大的采样偏差,而且转换行为的稀疏性也同样导致了样品的稀疏性。(如下图所示)

在这里插入图片描述

而这篇文章主要的目标就是优化上述问题。

2. 方法描述

这篇文章当中使用的方法是通过多任务学习的方式来利用起曝光但是没有被点击过的商品。

具体而言,文献中给出了一个假设,即商品的转化率和商品的点击率是一个相互独立的事件,而实际的用户转换行为文中用ctcvr来进行表述,则有:

p ( c v c t r ) = p ( c t r ) ∗ p ( c v r ) p(cvctr) = p(ctr) * p(cvr) p(cvctr)=p(ctr)p(cvr)

而模型训练的定义如下:

在这里插入图片描述

在训练过程中,同时对ctr和ctcvr两个进行训练,而在使用中,则是只使用cvr部分对转换率进行估计。

具体的loss函数定义如下:

L o s s = ∑ i = 1 N l c t r ( y i , p c t r ) + ∑ i = 1 N l c t c v r ( z i , p c t r ∗ p c v r ) Loss = \sum_{i=1}^N l_{ctr}(y_i, p_{ctr}) + \sum_{i=1}^N l_{ctcvr}(z_i, p_{ctr} * p_{cvr}) Loss=i=1Nlctr(yi,pctr)+i=1Nlctcvr(zi,pctrpcvr)

通过这种方式,就可以在训练过程中将所有的曝光数据全部使用进来。

3. 实验考察

而关于上述模型的具体实验效果如下表所示:

在这里插入图片描述

其中使用的数据集是阿里自己放出的商品数据集,其数据大小是其实际的商品数据总量的1/10,而随着数据总量的增加,上述策略的效果是稳定存在的,具体可以通过下图看出:

在这里插入图片描述

4. 结论 & 思考

整体而言,上述实验由于需要兼顾线上工程的performance,因此,其使用的模型事实上是一个简单的小模型,故效果来说大致看一下就行了。

这篇文章的精华个人认为还是在于将曝光数据的引入,使得模型可以学习到更多的商品与用户的行为信息。

但是,尽管这里的思路我是极其认可的,但关于其数据的使用方式却多少令我抱有一定的疑惑,因为虽然文中通过将ctcvr转换为了ctr以及cvr,从而可以将曝光数据也全部加入到训练当中,但是对于仅曝光而没有点击行为的数据,那么cvctr一定是0,进而对于cvr部分而言,事实上无法从标签当中获取什么有效信息,只能说见过这些数据,且当ctr预测越趋向于0的情况下,cvr那一次就越不需要学习太多有效的信息,即不需要进行太多的变化。

在这种情况下,从效果而言,模型确实学到了信息,但是总感觉这种方式有点奇怪,感觉用其他的数据增强方式也许可以获得更好的效果,当然,这个属于个人观点了……

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值