本文内容来自于由阿里巴巴达摩院领航举办的3月20日向量检索专场Meetup讲师演讲内容
讲师介绍 睿德
阿里巴巴淘系技术部,高级算法专家。从事推荐技术召回,排序算法的开发。
内容概述:
手淘首页的推荐面临着两个极具挑战性的问题:一是业务数据量巨大,包括十亿级的用户和商品; 二是首页开屏即现,对算法的响应时间有严格要求。在实际实践中,我们将推荐系统拆分为召回与排序两个子系统。其中,召回系统从海量的候选商品中挑选出与用户兴趣相关的商品集合,排序系统对该商品集合中的每一个商品依据业务目标进行打分,打分较高的商品作为推荐结果展示给用户。推荐算法的效果同时受到两个子系统的影响,召回作为算法的前置环节,更是决定了整个系统的效果上限。本次分享中,我们将分享 MIND 召回算法及其系统架构设计。
问题背景
▐ 应用场景
在一个典型的推荐场景中,推荐算法的任务是将一个经过筛选排序的,贴近用户兴趣的商品列表推荐给用户。下面两张图片展示了手机淘宝两个比较典型的推荐场景,分别是首页的信息流场景和微详情页场景。正如场景名字猜你喜欢所表达的,推荐算法的目标是使得推荐结果尽可能贴合用户的兴趣,满足用户的需求。
在实际的场景中,淘宝的数据体量相对较大,面对的是亿级的用户与亿级的商品。在这样体量的工业场景中,我们通常将整个推荐系统拆分为多个环节,其中召回(Match) 与排序 (Rank)是其中两个比较典型的环节。MIND 算法是我们团队针对召回环节的一项工作。
▐