本文介绍的论文名称是:《Representation Learning-Assisted Click-Through Rate Prediction》
论文下载地址为:https://arxiv.org/abs/1906.04365
本文的一个核心的思想是通过多任务的思路,建模特征之间的特定联系,从而提升CTR预估的效果。同时感觉将召回阶段的方法和精排阶段用到的方法融合到一个网络结构中,一起来学习一下。
1、背景
咱们前面也介绍过许多广告CTR预估中的常见模型了,如DeepFM、Wide & Deep。这些方法取得了一定的效果,但其存在一个弊端是仅考虑了特征与CTR之间的联系,而没有考虑特征之间存在的关系,如用户-广告 或者 广告-广告之间的关系,如下图所示:
特征之间的关系咱们举个简单的例子,如两个咖啡广告对应的Embedding,应该在空间中距离相近;而咖啡与服装的广告对应的Embedding,应该在空间中距离较远。DeepFM、Wide & Deep等方法并没有考虑这一层的关系,而仅仅考虑这些广告对应的Embedding对于CTR的影响。
基于上述的考虑,本文提出了DeepMCP模型,全拼是Deep Matching, Correlation and Prediction Model。从名字中也可以看出,该模型包含三个部分,分别是matching subnet、correlation subnet和prediction subnet。matching subnet用来建模用户和广告之间的关系、correlation subnet用来建模广告之间的关系,而prediction subnet则是用来建模特征-点击率之间的关系。
接下来咱们介绍下DeepMC