一文看懂推荐系统：排序12：xDeepFM模型，并不是对DeepFM的改进，而是对DCN的改进哦

最新推荐文章于 2024-08-17 08:37:49 发布

冰露可乐

最新推荐文章于 2024-08-17 08:37:49 发布

阅读量1k

点赞数

分类专栏：大厂人工智能技术概览个性化推荐系统大厂算法岗机器学习深度学习面试题文章标签：机器学习推荐系统排序 xDeepFM DCN 排序模型

本文链接：https://blog.csdn.net/weixin_46838716/article/details/126560803

版权

大厂算法岗机器学习深度学习面试题同时被 3 个专栏收录

123 篇文章 157 订阅

订阅专栏

大厂人工智能技术概览

57 篇文章 22 订阅

订阅专栏

个性化推荐系统

37 篇文章 67 订阅

订阅专栏

一文看懂推荐系统：排序12：xDeepFM模型，并不是对DeepFM的改进，而是对DCN的改进哦

提示：最近系统性地学习推荐系统的课程。我们以小红书的场景为例，讲工业界的推荐系统。
我只讲工业界实际有用的技术。说实话，工业界的技术远远领先学术界，在公开渠道看到的书、论文跟工业界的实践有很大的gap，
看书学不到推荐系统的关键技术。
看书学不到推荐系统的关键技术。
看书学不到推荐系统的关键技术。

王树森娓娓道来**《小红书的推荐系统》**
GitHub资料连接：http://wangshusen.github.io/
B站视频合集：https://space.bilibili.com/1369507485/channel/seriesdetail?sid=2249610

提示：文章目录

文章目录

一文看懂推荐系统：排序12：xDeepFM模型，并不是对DeepFM的改进，而是对DCN的改进哦
xDeepFM模型
- 一、论文动机
二、xDeepFM模型整体结构
三、xDeepFM中CIN网络结构
3.4 代码实现
四、联合训练目标函数
五、总结
总结

xDeepFM模型

这篇文章是中科大、北邮和微软合作发表在KDD’18上的文章，
从论文写作手法上来看充满了浓浓的学院风。
言归正传，乍一看论文标题xDeepFM还以为是对DeepFM的改进，

实际上不是，

xDeepFM是对上一篇博客中介绍的DCN（deep&cross network）的改进【上面30】，

这也是为什么这篇博客会介绍xDeepFM的原因。

本篇博客将会从一下几个方面来介绍xDeepFM：

论文动机
xDeepFM模型整体结构
xDeepFM中CIN网络结构
联合训练目标函数
总结

在这里插入图片描述

一、论文动机

这篇文章diss的一个重点就是DCN网络中cross network部分，
因此，个人强烈建议在看xDeepFM之前，请先移步去本人的上一篇博客看看DCN。

我们先来看看xDeepFM给出的论据：
在这里插入图片描述

二、xDeepFM模型整体结构

关于xDeepFM的整天网络结构，如下图所示（图片直接摘自原论文）：
在这里插入图片描述
从上图可以看出，xDeepFM依然延续了wide&deep，

DCN这种混合网络结构模式，
左手画个xxx网络用于构造高阶交叉特征，
右手画个普通DNN用于学习隐式的交叉特征，

最终一起联合训练。

xDeepFM这里包含三部分：
普通的线性部分、
CIN部分用于构造高阶交叉特征、
普通的DNN部分用于学习隐式特征。

这里核心部分显然在于CIN结果，本篇博客会重点讲解这个部分。

三、xDeepFM中CIN网络结构

CIN全称Compressed Interaction Network，我们照着论文中给出的图逐一讲解，先上图：

在这里插入图片描述
3.1 图（a）

老复杂了………………

3.2 图（b）

最后得到的是D宽度的向量，将m个向量做乘点积

3.3 图（c）

3.4 代码实现

paddle官方给出的cin部分的实现代码为（我增加了tensor的维度注释，方便大家理解）：

    def forward(self, feat_embeddings):
        # [shape=[5, 39, 9]]
        Xs = [feat_embeddings]
        last_s = self.num_field
        # layer_sizes_cin=[128, 32]
        # cnn_layers= [Conv2D(1521, 128, kernel_size=[1, 1], data_format=NCHW), 
        # Conv2D(4992, 32, kernel_size=[1, 1], data_format=NCHW)]
        for s, _conv in zip(self.layer_sizes_cin, self.cnn_layers):
            # 做外积，对应图（a）
            # Tensor(shape=[5, 9, 39, 1])
            X_0 = paddle.reshape(
                # shape=[5,9,39]
                x=paddle.transpose(Xs[0], [0, 2, 1]),
                shape=[-1, self.sparse_feature_dim, self.num_field,
                       1])  # None, embedding_size, num_field, 1
            # shape=[5, 9, 1, 39]
            X_k = paddle.reshape(
                x=paddle.transpose(Xs[-1], [0, 2, 1]),
                shape=[-1, self.sparse_feature_dim, 1,
                       last_s])  # None, embedding_size, 1, last_s
            # shape=[5, 9, 39, 39]
            Z_k_1 = paddle.matmul(
                x=X_0, y=X_k)  # None, embedding_size, num_field, last_s
            # 卷积操作，对应图（b）
            # compresses Z^(k+1) to X^(k+1)
            # shape=[5, 9, 1521]
            Z_k_1 = paddle.reshape(
                x=Z_k_1,
                shape=[-1, self.sparse_feature_dim, last_s * self.num_field
                       ])  # None, embedding_size, last_s*num_field
            # shape=[5, 1521, 9]
            Z_k_1 = paddle.transpose(
                Z_k_1, [0, 2, 1])  # None, s*num_field, embedding_size
            # shape=[5, 1521, 1, 9]
            Z_k_1 = paddle.reshape(
                x=Z_k_1,
                shape=[
                    -1, last_s * self.num_field, 1, self.sparse_feature_dim
                ]
            )  # None, last_s*num_field, 1, embedding_size  (None, channal_in, h, w)
            # shape=[5, 128, 1, 9]
            X_k_1 = _conv(Z_k_1)
            # shape=[5, 128, 9]
            X_k_1 = paddle.reshape(
                x=X_k_1,
                shape=[-1, s,
                       self.sparse_feature_dim])  # None, s, embedding_size
            #X_k_1 = m(X_k_1)
            Xs.append(X_k_1)
            last_s = s
        # 池化，图（c）
        # sum pooling
        # Xs-->Tensor(shape=[5, 39, 9]), Tensor(shape=[5, 128, 9]), Tensor(shape=[5, 32, 9]]
        # shape=[5, 160, 9]
        y_cin = paddle.concat(
            x=Xs[1:], axis=1)  # None, (num_field++), embedding_size
        # shape=[5, 160]
        y_cin = paddle.sum(x=y_cin, axis=-1)  # None, (num_field++)i
        tmp_sum = sum(self.layer_sizes_cin)
        # shape=[5, 1]
        y_cin = self.cin_linear(y_cin)
        # shape=[5, 1]
        return y_cin

四、联合训练目标函数

xDeepFM整体包含三部分：
线性部分、CIN部分、DNN部分。

论文给出了联合训练的交叉熵损失函数：
在这里插入图片描述

五、总结

个人认为xDeepFM参数量较大，计算复杂度应该相对较高，
在真实的场景下性能可能会成为一个问题。

至于效果，在不同的数据集下与其他模型可能会呈现出不同的结果，
例如DCN V2论文里给出的实验结果，
xDeepFM在AUC指标上在一些数据集上效果还不如DCN。

有兴趣的可以直接去看DCN V2这篇论文的实验比较部分，DCN V2论文地址：DCN V2。

总结

提示：如何系统地学习推荐系统，本系列文章可以帮到你

（1）找工作投简历的话，你要将招聘单位的岗位需求和你的研究方向和工作内容对应起来，这样才能契合公司招聘需求，否则它直接把简历给你挂了
（2）你到底是要进公司做推荐系统方向？还是纯cv方向？还是NLP方向？还是语音方向？还是深度学习机器学习技术中台？还是硬件？还是前端开发？后端开发？测试开发？产品？人力？行政？这些你不可能啥都会，你需要找准一个方向，自己有积累，才能去投递，否则面试官跟你聊什么呢？
（3）今日推荐系统学习经验：xDeepFM模型，并不是对DeepFM的改进，而是对DCN的改进哦，但是复杂度过于高了，不玩