【CTR模型】TensorFlow2.0 的 DCN(Deep & Cross Network) 实现与实战(附代码+数据)

最新推荐文章于 2025-04-17 12:09:57 发布

VariableX

最新推荐文章于 2025-04-17 12:09:57 发布

阅读量2.1k

点赞数 2

分类专栏： CTR 相关深度学习相关文章标签： DCN tensorflow2.0 ctr

本文链接：https://blog.csdn.net/VariableX/article/details/107733410

版权

本篇博客详细介绍了如何在TensorFlow2.0下实现Deep & Cross Network（DCN）模型，用于CTR（点击率）预测。通过Criteo数据集的子集进行实践，包括模型输入构造、Cross Network、DNN部分的实现，并提供了完整的代码。数据预处理、模型训练和输出部分也进行了说明。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

CTR 系列文章：

本篇文章讲解 DCN(Deep & Cross Network) 的 tensorflow2.0 实现，并使用 Criteo 数据集的子集加以实践。如果在看本文时有所困惑，可以看看 DCN(Deep & Cross Network) 的相关理论：CTR 模型之 Deep & Cross (DCN) 与 xDeepFM 解读。

本文使用的数据下载地址于代码获取地址在文末获取。

首先了解一下 Criteo数据集，它由有39个特征，1个label列，其中以I开头的为数值型特征，以C开头的为类别特征：

在这里插入图片描述

可以看到数据中有缺失值需要填充，并且类别变量需要进行类别编码(onehot 编码的任务交给模型)，这部分预处理的代码不详细讲了。

为了方便后面建立模型，先将特征划分为 dense 特征与 sparse 特征两个类别：

# 数值型
dense_feats = [f for f in cols if f[0] == "I"]
# 类别型
sparse_feats = [f for f in cols if f[0] == "C"]

Deep & Cross Network

DCN网络结构如下：

在这里插入图片描述

构造模型输入

对于 dense 特征，按下面的代码构造输入：

# 构造每个 dense 特征的输入
dense_inputs = []
for f in dense_feats:
    _input = Input([1], name=f)
    dense_inputs.append(_input)
# 将输入拼接到一起
concat_dense_inputs = Concatenate(axis=1)(dense_inputs)  # ?, 13

对于 sparse 特征，按下面的代码构造输入：

# 这里单独对每一个 sparse 特征构造输入，
# 目的是方便后面构造二阶组合特征
sparse_inputs = []
for f in sparse_feats:
    _input = Input([1], name=f)
    sparse_inputs.append(_input)

# embedding size
k = 8
# 对sparse特征进行embedding
sparse_kd_embed = []
for _input in sparse_inputs:
    f = _input.name.split(':')[0]
    voc_size = total_data[f].nunique()
    _embed = Flatten()(Embedding(voc_size, k, embeddings_regularizer=tf.keras.regularizers.l2(0.7))(_input))
    sparse_kd_embed.append(_embed)

最低0.47元/天解锁文章