Path-based Deep Network for Candidate Item Matching in Recommenders
2021-SIGIR-阿里、蚂蚁
介绍了工业界主流的两种召回方式及对应的特点,提出PDN整合两种召回方式。
1 INTRODUCTION
- a matching stage is expected to retrieve a small fraction of relevant items in low latency and computational cost
- a ranking stage aims to refine the ranking of these relevant items in terms of the user’s interest with more complex models
本文关注于召回阶段
- item-based CF(item-to-item based collaborative filtering),基于物品的共现模式估计两个Item的相关性。
- 缺点:传统的反序索引很难满足个性化的需要;只考虑Item共现关系,没有使用附加信息,遭受稀疏性问题
- EBR(embedding-based retrieval),通常使用双塔模型。通过分别嵌入u i的特征来表示用户和物品,将问题转化为在嵌入空间中找最近邻。
- 缺点:双塔模型很难显式整合物品间的共现关系;一个用户总是表示成一个嵌入向量,不合适编码用户的多样化兴趣
- 为了同时捕获用户的多样化和个性化兴趣,通常使用多种策略(各种不同网