阿里CTR预估三部曲（3）：Deep Session Interest Network for Click-Through Rate Prediction简介

最新推荐文章于 2022-04-26 18:03:15 发布

loserChen.

最新推荐文章于 2022-04-26 18:03:15 发布

阅读量2.9k

点赞数

分类专栏：论文学习文章标签： DSIN CTR 阿里

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35564813/article/details/90943958

版权

论文学习专栏收录该内容

41 篇文章 0 订阅

订阅专栏

阿里CTR预估三部曲（3）：Deep Session Interest Network for Click-Through Rate Prediction

Introduction

文章主要提出对于用户表现sessions，同一个session内的兴趣是相近的，而不同session之间的兴趣是异质的,因此DSIN应运而生来解决上述的问题，其中利用自注意力网络来获取sessin的兴趣表示，然后使用双向lstm来捕捉序列关系，最后利用local activation单元来整合目标item对于不同session兴趣的重要性。

DSIN

在这里插入图片描述

DSIN在全连接层之前，分成了两部分，左边的那一部分，将用户特征和物品特征转换对应的向量表示，这部分主要是一个embedding层，就不再过多的描述。右边的那一部分主要是对用户行为序列进行处理，从下到上分为四层：
1）序列切分层session division layer
2）会话兴趣抽取层session interest extractor layer
3）会话间兴趣交互层session interest interacting layer
4）会话兴趣激活层session interest acti- vating layer

接下来，我们主要介绍这4层。

Session Division Layer

为了准确地抽取用户的兴趣，作者将用户表现序列切分成多个sessions，切分规则是是否前后时间间隔超过30分钟。

Session Interest Extractor Layer

为了更好地发掘session内的用户表现行为，文章采用多头自注意力机制，同时也做了一些自注意力机制中的改变，提升了性能。

Bias Encoding

文章中对于位置关系的编码没有采用[《attention is all you need》](Attention Is All You Need简析)中所示的positional encoding，而是采用bias encoding。

在这里插入图片描述

从文章的介绍来看，BE是K*T* $d_{model}$ 的，而 $BE_{(k,t,c)}$ 的意思是对第k个session中，第t个物品的嵌入向量的第c个位置都加上偏置项。

所以加入偏置项后，Q变为：

在这里插入图片描述

Multi-head Self-attention

该部分与《attention is all you need》一致，同时可以参考https://mp.weixin.qq.com/s/RLxWevVWHXgX-UcoxDS70w这篇文章一起理解。

###Session Interest Interacting Layer

该部分就是一个双向的lstm，同时最后的结果通过相加前向及后向的最后一个hidden state得到最终结果。

在这里插入图片描述

Session Interest Activating Layer

用户的会话兴趣与目标物品越相近，那么应该赋予更大的权重，这里使用注意力机制来刻画这种相关性：

在这里插入图片描述

同时对于混合了上下文信息的会话兴趣，一样也使用注意力机制来刻画这种相关性：

在这里插入图片描述

最后将用户的偏好，物品的偏好， $U^I和U^H$ concat一起后送入MLP层进行计算，得出最终结果。

Experiments

在这里插入图片描述

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
阿里CTR预估三部曲（3）：Deep Session Interest Network for Click-Through Rate Prediction简介

##阿里CTR预估三部曲（3）：Deep Session Interest Network for Click-Through Rate PredictionIntroduction文章主要提出对于用户表现sessions，同一个session内的兴趣是相近的，而不同session之间的兴趣是异质的,因此DSIN应运而生来解决上述的问题，其中利用自注意力网络来获取sessin的兴趣表示，然后使...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。