DSIN模型

最新推荐文章于 2024-04-19 10:03:59 发布

futurewq

最新推荐文章于 2024-04-19 10:03:59 发布

阅读量501

点赞数 1

分类专栏：面试文章标签：人工智能深度学习推荐算法

本文链接：https://blog.csdn.net/wangrongrongwq/article/details/129238284

版权

面试专栏收录该内容

27 篇文章 3 订阅

订阅专栏

DSIN模型通过会话划分、兴趣提取、交互和激活等四层结构，分析用户在不同会话中的行为差异和兴趣演化。模型利用多头注意力机制学习会话内商品关联，双向LSTM捕捉会话间兴趣变化，最终通过注意力机制关注与目标广告相关的兴趣路径。

摘要由CSDN通过智能技术生成

在这里插入图片描述

DSIN模型提出得动机：用户得行为是由会话组成得，在每个会话内部用户得行为是相似得，会话之间得用户的行为是存在较大差异性得，而其他模型都没有关注这点，所以就有了DSIN模型。

在这里我们来讲下DSIN关键得四层，其他得就不再赘述了。:

1.会话划分层(session division layer)：就是在用户行为序列输入到模型之前，要按照固定得时间间隔(论文中是30分钟)给他分开段，每一段里面得商品序列成为一个会话session.

2.会话兴趣提取层(session interest extractor layer):针对每个session，作用使用多头得注意力机制，来学习一个会话里面各个商品之间得关联关系。

3.会话交互层(session interest interacting layer)：会话与会话之间得关系能够学习用户兴趣得演化规律，这里用了双向得LSTM

4.会话兴趣局部激活层(session interest activating layer)：既然会话内各个商品之间得关系已经学到了，会话与会话之间关系也已经学到了。当然也是针对性得模拟与目标广告相关得兴趣进化路径了，这里就是注意力机制，每次关注于当前商品更相关得兴趣。

1. Session Division Layer

2. Session Interest Extractor Layer

3. Session Interest Interacting Layer

4.Session Interest Activating Layer

1. Session Division Layer

这一层是将用户得行为序列进行切分，首先将用户得点击行为按照时间排序，判读两个行为之间得时间间隔，如果前后间隔大于30min(论文中得值)，就进行切分。

在这里插入图片描述

划分完了之后，我们就把一个行为序列S转成了Session Q。在第k个会话 $Q_k$ ,又包含了T个行为，即

bi表示的是第k个会话里面得第i个点击行为(具体得item),它是一个dmodel维得embedding向量。所以Qk是一个T乘dmodel维。而整个大Q,就是一个K*T*dmodel维得矩阵。这里得K指的是session得个数，T指的是每个session中得行为个数，dmodel是每个行为得embedding向量维度。

2. Session Interest Extractor Layer

这里用得transformer得编码块逻辑，我们来依次看，首先是位置编码，作者这里做了些改进，称为bias encoding.作者这里没用使用transformer中得positioning encoding方式得原因是，这里还需要考虑各个会话之间得位置信息，毕竟这里是多个会话，并且各个会话之间也是又位置顺序得，所以还需要对每个会话添加一个positional encoding，在DSIN中，这种对位置得处理，称为bias encoding。

这里得位置编码 $BE\in{R^{K*T*d_{model}}}$ ,计算公式如下:

BE(k,t,c)表示的是第k个会话中，第t个物品在第c维度这个位置上得偏置项。w^K表示得是会话层次上得位置信息，如果又n个样本得话，这个应该是[n,K,1,1]得矩阵，后面两维度表示得是T和emb_dim。w^T表示的是这个会话里面时间位置层析上得偏置项(位置信息) ，这个应该是[n,1,T,1]得矩阵。w^C表示的是这个embedding维度层次上得偏置(位置信息)，这个应该是[n,1,1,dmodel]得矩阵。

所以经过Bias编码之后，得到得结果如下: