该算法来自论文《Multi-Interest Network with Dynamic Routing for Recommendation at Tmall 》。这篇论文的一作来自阿里巴巴团队。作者在实验部分展示了该算法子Tmall上的效果。
一、研究动机
推荐系统主要有召回和排序阶段,算法 MIND解决召回问题,即从大量的数据中取出上千个相关的item。召回的方式有很多,经典的有协同过滤和模型召回。模型召回的方法的思路是学习user向量和item向量,通过向量的相似度选出与user相关的item。
现有的大量模型召回方法是为每个user学习一个向量,对于像Tmall这种大型的商场网站中,用户的兴趣是多样的,其点击的商品也会是多种类别的。因此,一个向量是无法充分建模user的兴趣画像。作者提出了一种MIND的算法来为每个user学习多个向量,多个向量可以捕捉user兴趣的多样性。
二、MIND算法
每个样本被处理成三元组的形势,即(user特征;user行为,即user交互过的item;目标item)。对于单个user,MIND的输入是user的特征和行为;目标item用户指导模型训练,也就是作为监督信息。MIND的输出是K个D维的向量,D是单个向量的维度,K是兴趣向量的个数。在计算user和item的相似度时,分别去计算item与user的每一个兴趣向量的相似度,然后取最大值。公式如下: