1、原理
Deep&Cross Network模型我们下面将简称DCN模型:
一个DCN模型从嵌入和堆积层开始,接着是一个交叉网络和一个与之平行的深度网络,之后是最后的组合层,它结合了两个网络的输出。完整的网络模型如图:
图1、the Deep & Cross Network
嵌入和堆叠层
我们考虑具有离散和连续特征的输入数据。在网络规模推荐系统中,如CTR预测,输入主要是分类特征,如“country=usa”。这些特征通常是编码为独热向量如“[ 0,1,0 ]”;然而,这往往导致过度的高维特征空间大的词汇。为了减少维数,我们采用嵌入过程将这些离散特征转换成实数值的稠密向量(通常称为嵌入向量):
x e m b e d = x e m b e d , i x i x_{embed} = x_{embed,i} x_{i} xembed=xembed,ixi
然后,我们将嵌入向量与连续特征向量叠加起来形成一个向量:
x 0 = [ x e m b e d , 1 T , . . . , x e m b e d , k T , x d e n s e T ] x_{0} = [ x_{embed,1}^T, ...,x_{embed,k}^T,x_{dense}^T] x0=[xembed,1T,...,xembed,kT