CTR深度学习模型之 DIN(Deep Interest Network) 的理解与例子

最新推荐文章于 2023-05-11 08:00:00 发布

VariableX

最新推荐文章于 2023-05-11 08:00:00 发布

阅读量4.7k

点赞数 8

分类专栏：深度学习相关 CTR 相关文章标签： DIN CTR 深度学习

本文链接：https://blog.csdn.net/VariableX/article/details/108796376

版权

在电商领域，每个用户都有丰富的历史行为数据，这些数据具有如下特点：多样性（Diversity）：用户可能对多种商品感兴趣，例如手机、衣服。局部激活（Local Activation）：用户是否点击新商品，仅仅取决于历史行为中与新商品相关度高的部分数据。如何从中捕获特征对CTR预估模型非常重要。论文《Deep Interest Network for Click-Through Rate Prediction 提出了深度兴趣网络 Deep Interest Network，以下简称 DIN

摘要由CSDN通过智能技术生成

在电商领域，每个用户都有丰富的历史行为数据，这些数据具有如下特点：

多样性（Diversity）：用户可能对多种商品感兴趣，例如手机、衣服。
局部激活（Local Activation）：用户是否点击新商品，仅仅取决于历史行为中与新商品相关度高的部分数据。

如何从中捕获特征对CTR预估模型非常重要。论文《Deep Interest Network for Click-Through Rate Prediction 提出了深度兴趣网络 Deep Interest Network，以下简称 DIN 模型，设计了类似 attention 的网络结构来激活历史行为数据中与候选广告相关度高的行为，即：增大与目标广告相关性高的历史行为权重。

模型解读

基准模型

论文并没有直接讲解DIN模型，而是先介绍了基准模型的结构：

在这里插入图片描述

此模型主要功能是将输入的用户特征、行为特征、候选广告以及上下文特征转换成 embedding，然后将这些 embedding 拼接在一起用几个全连接层完成点击率的预测。这里面有几个需要注意的细节：

1，用户行为序列的长度一般是不同的，所以为了能够将不同序列长度的embedding 向量转换成相同的大小，一种思路是将所有的 embedding 向量进行 sum pooling，即对所有 embedding 向量求和，得到一个固定大小的向量，作为全连接层的输入。

2，直接对行为的 embedding 向量求和，会损失很多信息，即：无法捕捉到候选广告与历史行为信息中的局部相关性。

DIN模型

于是，在论文中又提出了改进后的模型: DIN，网络结构如下图：

在这里插入图片描述

与基准模型相比，最大的区别在于：引入了与 attention 机制功能相似的 Activation Unit 用于根据候选广告计算历史行为的权重。

如果用 { $e_1, e_2, ... , e_H$ } 表示用户 U 对 H 个商品行为 embedding 向量， $v_A$ 表示候选广告的向量，那么用户 U 对广告 A 的兴趣向量 $v_U(A)$ 可以用下面的公式计算：
$v_U(A) = f(v_A,e_1,e_2,...,e_H)=\sum_{j=1}^Ha(e_j,v_A)e_j=\sum_{j=1}^Hw_je_j$
其中，

最低0.47元/天解锁文章

VariableX

关注

8
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
CTR深度学习模型之 DIN(Deep Interest Network) 的理解与例子

在电商领域，每个用户都有丰富的历史行为数据，这些数据具有如下特点：多样性（Diversity）：用户可能对多种商品感兴趣，例如手机、衣服。局部激活（Local Activation）：用户是否点击新商品，仅仅取决于历史行为中与新商品相关度高的部分数据。如何从中捕获特征对CTR预估模型非常重要。论文《Deep Interest Network for Click-Through Rate Prediction 提出了深度兴趣网络 Deep Interest Network，以下简称 DIN
复制链接

扫一扫