熟悉双塔的人都知道,在用户侧,模型最后往往都生成一个向量去检索,这个向量不足以表达用户的多兴趣,《Multi-Interest Network with Dynamic Routing for Recommendation at Tmall》这篇就提出了一个label-aware attention把用户表达为多个兴趣。
左图展示了天猫给上亿用户个性化的推荐,右图展示了商品丰富的品类,我们肯定不希望最近买了个iphone12,打开天猫,一整面的手机配件商品推荐,多兴趣的目标,也是增加推荐的多样性。天猫上亿的用户,每个人都要每天浏览上百的商品,这些商品不同的类目,就反应了用户不同的兴趣。废话不多说,下面直入论文主题。
问题定义
多兴趣的目标,就是为每个用户从上亿规模的商品集合I中找到候选集,该候选集一般有几千个商品,都和该用户当前的兴趣相关。历史数据就尤为重要了,当前兴趣和历史行为强相关。每个样本都能表达为一个三元组(Iu, Pu, Fi),Iu表示历史上,和用户交互过的商品。Pu就是用户的基础特征(年龄性别啥的),Fi就是商品的特征了(itemid, 类目id)。
这篇论文的模型,目标就是把每个用户历史交互特征和基本特征映射成多个向量: