【论文导读】Wide&Deep模型的进阶---Cross&Deep模型，附TF2.0复现代码

最新推荐文章于 2023-09-03 13:41:19 发布

Blank_spaces

最新推荐文章于 2023-09-03 13:41:19 发布

阅读量595

点赞数

文章标签：网络机器学习深度学习 python 人工智能

本文链接：https://blog.csdn.net/Blank_spaces/article/details/107373985

版权

本文介绍了斯坦福与谷歌2017年提出的Deep & Cross Network (DCN)，它改进了Wide&Deep模型的Wide部分，通过Cross Network自动进行特征交互。DCN由Embedding和Stacking层、Cross网络和Deep网络并列、输出合并层组成，其Cross Network是模型创新点，能高效进行特征交互，且参数数量线性增长。文章还提供了Tensorflow 2.0的代码复现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

今天分享一篇斯坦福与谷歌2017发表的推荐论文《Deep & Cross Network for Ad Click Predictions》。本文的亮点是作者提出了Cross网络来增强特征之间的交互。

本文约2.3k字，预计阅读15分钟

Deep & Cross Network for Ad Click Predictions

Deep&Cross模型是2017年由斯坦福大学和谷歌在ADKDD会议上联合提出的，该模型是对Wide&Deep模型的一种改进。由于Wide&Deep模型的Wide部分的特征交互需要特征工程，而手工设计特征工程非常的繁琐【虽然好的特征工程是在比赛中很多模型成功的关键因素之一】。2阶的FM模型在线性的时间复杂度中自动进行特征交互，但是这些特征交互的表现能力并不够，并且随着阶数的上升，模型复杂度会大幅度提高。所以**作者对Wide部分进行更改，提出了一个Cross Network来自动进行特征之间的交叉，并且网络的时间和空间复杂度都是线性的。**通过与Deep部分相结合，构成了深度交叉网络（Deep & Cross Network），简称DCN。

Deep & Cross

模型的结构非常简洁，从下往上依次为：Embedding和Stacking层、Cross网络层与Deep网络层并列、输出合并层，得到最终的预测结果。

Embedding and Stacking Layer

根据模型结构图我们发现，输入的特征分为密集型【连续】特征和稀疏离散型特征。但大部分特征都为分类的稀疏特征，为了输入到网络中，一般将进行one-hot编码操作，但这样会导致过高的维度特征空间。因此需要Embedding操作将高维稀疏特征转化为低维密集型特征：

其中对于某一类稀疏分类特征（如id），是第个分类值（id序号）的embedding向量。表示该类特征的embedding矩阵，表示embedding的隐藏单元，表示该类特征的数量（如id的总数）。表示某个样本在该特征的二元稀疏向量（如id=1的one-hot向量）。【实质上就是在训练得到的Embedding参数矩阵中找到属于当前样本对应的Embedding向量】