EGES算法实在论文《Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba》,主要用于商品推荐中。这篇论文的一作是阿里巴巴团队的,实验部分说该算法应用在了淘宝中。本人最近刚入职某公司,从事推荐算法的工作,因此后续会分享一下推荐相关的算法或者心得。
一、研究动机
1. 扩展性。现有的大部分推荐系统可以运用在一百万的用户和商品中,但无法运用在拥有十亿的用户和二十亿商品的淘宝中。
2. 稀疏性。用户往往只和少量的商品交互,因此很难去训练一个精确的推荐模型。
3. 冷启动。淘宝上每小时会有百万级的新商品被上传。由于这些商品没有用户行为的信息(点击、购买等),因此很难预测用户对这些商品的喜爱程度。
作者设计了一个两阶段的推荐框架:匹配(或召回)和排序。这也是一般推荐模型的框架。作者在这篇文件主要是解决了匹配阶段的问题,通过用户行为计算商品间两两的相似性。相似性topK的商品输入到排序阶段。接下来是算法流程。
图1
二、通过用户行为构建Item图
统一将商品称为Item。用户的点击行为往往是序列化的,比如图1(a)中的用户U1,我们经常点击商品D后