Category-Specific CNN for Visual-aware CTR Prediction at JD.com
Hu Liu, Jing Lu, Hao Yang, Xiwei Zhao, Sulong Xu, Hao Peng, Zehua Zhang, Wenjie Niu, Xiaokun Zhu, Yongjun Bao, Weipeng Yan
Business Growth BU, JD
https://dl.acm.org/doi/pdf/10.1145/3394486.3403319
京东,是中国最大的B2C电商平台之一,具有一流的广告系统,服务于数百万广告主和数亿消费者。
该系统,跟大多数电商场景一样,广告是以图片形式展示的。这使得视觉感知的点击率预估非常重要,不仅从商业角度,而且从用户体验角度也是如此.现有算法通常利用现成的卷积神经网络来提取视觉特征,然后将视觉特征和非视觉特征融合起来,用于最终的点击率预估。
尽管该领域已经有很多研究,但是该领域仍然面对两个关键挑战。其一,尽管离线研究取得了喜人的进展,在实际系统中应用卷积神经网络并不简单,一方面线上对高效的端到端训练要求比较严格,另一方面,线上服务对低延时要求比较高。
其二,现成的卷积神经网络,以及后续的融合结构不是最优的。具体而言,现成的卷积神经网络是用于分类任务的,没有将类别作为输入特征。在电子商务中,类别是精确标注的,包含丰富的视觉先验知识,有助于视觉建模。忽略了广告类别,卷积神经网络也许会提取一些非必须的类别无关特征,浪费卷积神经网络的本身就有限的表达能力。
为了克服上述两个挑战,作者们提出类别卷积神经网络,CSCNN,用于点击率预估。CSCNN将类别知识利用轻量加权注意力模块融入每一个卷积层中。这就使得CSCNN提取到表达能力更强的类别视觉模式,有助于点击率预估。
在离线实验中,作者们利用了两个数据集,一个基准数据集,一个京东的百亿规模的真实生产数据集,同时结合在线的AB测试,结果表明,CSCNN效果优于STOA算法。作者们构建了高性能架构,24小时内在百亿规模真实生产数据集上完成端到端的训练,线上系统中满足了低延时需求,CPU上耗时20ms。CSCNN已经部署在京东的搜素广告系统中,服务于数亿活跃用户的主流量场景中。
这篇文章的主要贡献如下