论文连接:Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba
摘要:
阿里推荐系统的三大挑战,可扩展性(scalability),稀疏性(sparsity)和冷启动(cold start)。
首先通过用户历史行为构建item graph,并在graph上学习item的embedding,这个embedding用于学习item之间的pairwise similarities。为了解决稀疏性和冷启动问题,在graph embedding framework里引入side information。并提出两种聚合方法来集成item的embedding和相关的side information。加了side information的方法优于不加side information的方法。
淘宝应对可扩展性、稀疏性和冷启动三个问题设计一个two-stage框架,matching和ranking。matching拣选商品,ranking给商品排序。本文主要关注在matching阶段,这个阶段核心任务是基于user行为计算所有item的pairwise similarities。
首先基于user行为历史构建item embedding graph->dubbed Base Graph Embedding(BGE),其次考虑到那些新的item或者有极少user交互的item,引入side information构建dubbed Graph Embedding with Side information(GES)。接着考虑到不同类型的side information,就提出带权的GES