论文下载地址
目的
根据用户的历史行为序列建立多兴趣网络模型
整体思路
首先,利用多头注意力机制表示历史行为item,并借助辅助任务帮助历史行为item表示的学习;之后,再次通过多头注意力机制的每个head表示一个兴趣,将多个兴趣(head)拼接起来;最后,上一步拼接得到的向量和上下文信息、用户属性信息、目标item信息一起拼接输入到mlp中得到结果
实现细节
-
符号定义:
x u : x_u: xu: 用户属性信息
x b : x_b: xb: 用户行为序列, x b = { e 1 , e 2 , . . . , e T } ∈ R T × d m o d e l : x_b=\{e_1,e_2,...,e_T\}\in\mathbb R^{T\times d_{model}}: xb={ e1,e2,...,eT}∈RT×dmodel: T T T表示序列的长度, d m o d e l d_{model} dmodel表示每个item embedding的维度大小
x c : x_c: xc: 上下文信息
x t : x_t: xt: 目标item,embedding维度和行为序列维度相同
p t : p_t: p