论文题目:Deep & Cross Network for Ad Click Predictions
作者:Ruoxi Wang、Bin Fu、Gang Fu、Mingliang Wang
1 论文要点
该模型是对Wide&Deep模型的一种改进。由于Wide&Deep模型的Wide部分的特征交互需要特征工程,而手工设计特征工程非常的繁琐。
所以作者对Wide部分进行更改,提出了一个Cross Network来自动进行特征之间的交叉,并且网络的时间和空间复杂度都是线性的。通过与Deep部分相结合,构成了深度交叉网络(Deep & Cross Network),简称DCN。
2 数据集
本文使用Criteo数据集进行测试。数据集大小共11GB,包含4100万条数据,它由13列数值特征(Dense Input)和26列类别特征(Sparse Input)组成。其表示如下:
- Label:标签,表示目标广告点击(1)或未点击(0);
- I1-I13:13个数值特征,也称为计数特征;
- C1-C26:26个分类特征(稀疏特征),为了匿名化的目的,对数据进行了脱敏感处理,没法知道每一列的具体含义,这些特性的值被编码散列到32位上;