[搜广推]深度学习推荐模型（5）——Wide&Deep模型

原创已于 2024-12-25 18:07:02 修改 · 1.2k 阅读

20 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #人工智能 #推荐算法 #算法

于 2024-12-25 18:00:29 首次发布

搜广推专栏收录该内容

19 篇文章

订阅专栏

Wide&Deep 模型

Wide & Deep模型由Google在2016年提出。它旨在结合线性模型（Wide部分）的记忆能力和深度学习模型（Deep部分）的泛化能力，以解决推荐系统中的记忆性（Memorization）和泛化性（Generalization）问题。

基本思想

Wide&Deep模型的主要思路正如其名，是由单层的Wide部分和多层的Deep部分组成的混合模型。其中：

Wide部分的作用是让模型具有记忆能力（memorization）
Deep部分的作用是让模型具有泛化能力（generalization）

这样的结构使模型兼具了逻辑回归和深度神经网络的优点：

能够快速处理并记忆大量历史行为特征
具有强大的表达能力

记忆能力和泛化能力

记忆能力（Memorization）：模型能够准确记住训练数据集中的特定模式和规律，并在相似的新数据上重现这些模式的能力。
具有强记忆能力的模型通常能够：

捕捉历史数据：记住用户过去的交互和选择，比如用户曾经购买过的商品或浏览过的内容。
重现用户偏好：在新的推荐中重现用户的已知偏好，例如推荐用户过去喜欢的音乐、电影或产品。
减少信息丢失：在处理大量数据时，能够保留关键信息，避免因模型复杂度不足而丢失重要特征。

然而，记忆能力强的模型可能会过度拟合训练数据，导致在未见过的数据上表现不佳。

泛化能力（Generalization）：模型在未见过的数据上进行准确预测的能力。
具有强泛化能力的模型能够：

识别新模式：在新的、未见过的数据上识别出模式和规律，即使这些数据与训练数据不完全相同。
适应新情况：适应新环境和新用户，即使这些用户的行为模式与训练数据中的用户不同。
减少过拟合：避免在训练数据上过度拟合，保持模型在新数据上的预测能力。

泛化能力强的模型通常能够更好地处理新数据，但可能在捕捉训练数据中的细微模式方面不如记忆能力强的模型。

记忆与泛化的平衡
在推荐系统中，理想的模型应该同时具备良好的记忆能力和泛化能力。

通常来说，简单线性模型的“记忆能力”强，深度神经网络的“泛化能力”强，因此通过结合线性模型（Wide部分）的记忆能力和深度学习模型（Deep部分）的泛化能力，能够在保留用户历史偏好的同时，探索和学习新的用户行为模式，从而同时具备良好的记忆能力和泛化能力。

网络结构

在这里插入图片描述
Wide部分（单输入层）

Wide部分通常指的是一个简单模型。简单模型善于记忆用户行为特征中的信息，并根据此类信息直接影响推荐结果。例如图中的已安装应用和曝光应用。

在Wide部分中，通常使用交叉积变换函数组合多个特征：
$_k(X) = ∏_{i=1}^d x_i^{c_{ki}} ， c_{ki} ∈ {0,1}$
其中， $_k(X)$ 表示第k个组合特征的交叉积变换结果， $c_{ki}$ 是一个布尔变量，当第i个特征属于第k个组合特征时， $c_{ki}$ 的值为1，否则为0。