今天给大家介绍的是阿里公开的一篇论文,主要介绍如何使用统一的模型在多domain进行CTR预估。论文标题为《One Model to Serve All: Star Topology Adaptive Recommender for Multi-Domain CTR Prediction》,一起来看一下。
1、背景
在大的电商公司如阿里和亚马逊,通常需要对多个业务domain的商品进行点击率预估,如下图所示,顶部的banner和猜你喜欢频道均需要进行CTR预估。
对于这种多domain的情况,常见的做法是每个domain使用自己独有的数据训练单独的模型,并单独部署上线。这种做法存在一定的缺陷,首先,部分业务线的数据比较稀疏,模型难以得到充分的训练,其次,不同的业务线的模型单独训练,需要更多的计算资源和人力资源消耗。
不同domain的用户和商品具有一定的交集,因此不同domain的信息共享,在一定程度上可以提升CTR预估模型的效果,但同时,不同的domain的用户行为存在一定的差异,导致数据分布存在一定差异,简单的混合所有domain的数据来学习一个共享的模型,用于所有domain的CTR预估,可能达不到预期的效果。那么,如何有效利用各域的数据,使用统一的模型来进行multi-domain的CTR预估呢?接下来,一起来学习下论文中提出的方法。
2、方法介绍
论文中提出的方法称作star topology adaptive recom- mender (STAR),其整体的结构如下图所示:
该结