阿里新突破!自主创新的下一代匹配&推荐技术:任意深度学习+树状全库检索

本文介绍了阿里在推荐、搜索、广告投放领域的技术突破,提出了一种新的匹配和推荐算法框架——Tree-based Deep Match(TDM)。TDM利用层次化树结构和深度学习模型,解决了匹配阶段效率与效果的矛盾,实现了全库检索的高效性和深度模型的灵活性。通过树-模型联合训练,TDM在召回率和新颖性上取得了显著提升,为推荐系统的未来发展提供了新方向。
摘要由CSDN通过智能技术生成

阿里妹导读:电商时代,消费者对推荐系统已经不再陌生。蓦然回首,你会发现喜欢的商品就在显眼处。如何设计推荐系统,让消费者更方便地从海量商品中找到自己的最爱,阿里工程师一直在不断探索更优的算法和技术。


阿里妈妈精准定向技术团队,针对大规模候选集上的匹配推荐问题,自主创新提出了一套崭新的、完整的基于树结构的匹配和推荐算法框架,希望借此赋能任意深度学习模型在推荐匹配中的使用,实现面向全量大规模候选集的精准匹配和推荐。下面让我们一起来深入了解、探讨。


I 背景


推荐、搜索、广告投放是互联网内容提供商进行流量分配的核心业务,也是大数据和机器学习技术的典型应用场景。无论是推荐,搜索,还是广告投放问题,都可以描述为从大规模候选中给用户提供有限的展现结果以获取用户的正向反馈(广告投放还需额外考虑广告主意愿和体验)。


在具体实现中,由于在线业务对性能尤其是响应时间的严格要求,我们往往会把上述过程拆分为两个阶段——匹配(Match)+排序(Rank)。以淘宝推荐系统为例,匹配阶段的核心在于如何从全量商品(Item)中根据用户(User)信息召回合适的TopK候选集合,排序阶段则是对TopK候选集合进行精细化打分并排序输出最终展现的结果。排序阶段因为候选集小,可以引入诸如深度学习等非常复杂的模型来优化目标,达到最终效果(相关性、广告收益等)的提升,业界对此阶段的研究比较集中和深入,比如阿里妈妈精准定向广告业务团队在排序阶段的CTR(Click-through Rate)预估上引入了基于Attention结构的深度兴趣模型(DIN,https://arxiv.org/abs/1706.06978),取得了非常好的业务效果。


而匹配阶段由于问题规模大,复杂模型在此阶段的应用存在一定的局限性,所以业界对这方面的研究尤其是深度学习在此阶段的应用仍处在发展阶段。回到上述关于两阶段的描述,可以看出匹配阶段产生的候选集的质量会成为最终效果的天花板,因此如何创新和发展匹配技术是对业务有着重大意义的问题,也一直是业界和学术界关注的重点问题。


以推荐为例,在工业级的推荐系统中,匹配阶段往往面临很多技术挑战。例如当候选集非常大的时候,要从全量候选集中挑选TopK集合,我们无法接受随着全量候选集大小而线性增长的时间复杂度,这使得一些学术界研究的需要计算全量 {User,Item} 兴趣度的方法并不能真正应用于实际推荐系统中的匹配阶段。在有限的计算资源下,如何根据用户信息从全量候选集中快速得到高质量的TopK候选集,需要在计算效率和计算准确性上做精巧的平衡。作为真实应用的推荐系统,其匹配阶段的计算时间需要被限制,简单用以下公式表示:

公式(1)

其中T表示单次计算的时间消耗,N可以认为是为单个用户召回TopK需要的总体计算次数。在上述公式的约束下,围绕如何提升匹配效果,工业界的技术发展也经历了几代的演进,从最初的基于统计的启发式规则方法,逐渐过渡到基于内积模型的向量检索方法。然而这些方法在技术选型上都在上述计算效率约束下对匹配效果进行了很大的牺牲。如何在匹配阶段的计算效率约束下引入更先进的复杂深度学习模型成为了下一代匹配技术发展的重要方向。

 

II 相关技术


如上文所述,结合工业级推荐系统的约束,匹配技术经历了从基于统计的启发式规则方法到基于内积模型的向量检索方法的转变,具体描述如下:


I)第一代——基于统计的启发式规则方法


这一类方法的经典代表就是Item-based Collaborative Filtering(以下简称Item-CF),也是业界应用最广的推荐算法之一。Item-CF的算法原理是:首先通过统计计算得到Item to Item(I2I)的相似关系,其次启发式地获取用户近期行为作为Trigger Item集合,用它们进行I2I扩展,最后以某种打分规则对扩展后的Item集合进行排序,截断得到TopK作为候选集进行后续排序流程。结合公式(1),我们可以知道这种方法有效的控制了总体计算次数N,因为用户的Trigger Item集合是有限的,相似关系圈定的候选集合也是有限的,从而避免了对全量候选集的计算,同时简单的打分规则可以有效地控制单次计算时间T,两者使得最终整体方法的计算量较少,满足了在线应用的要求。


这类方法简单有效,应用也比较广泛,但从算法原理不难看出,这种方法天然存在一大弊端:它限制了尝试推荐给用户未曾行为过但可能感兴趣的Item的可能性。这种将候选限定在历史兴趣相似范畴内的启发式规则对推荐效果的提升有限,它降低了用户体验(尤其是推荐结果的惊喜度),也制约了系统整体的可持续发展能力。尽管后续的排序环节可以引入复杂的机器学习方法,例如MLR(混合逻辑回归,https://arxiv.org/abs/1704.05194),FM(因子分解)或者深度学习,但它们都依赖于匹配给出的候选结果,所以无论如何复杂的模型都突破不了匹配给定的上限

 

II)第二代——基于内积模型的向量检索方法


引入机器学习方法来提升匹配能力是业界共识和趋势。机器学习本质上是一个衡量模型,可以衡量用户对商品的兴趣度。这种基于模型的匹配方法理论上要衡量一个用户对所有商品的兴趣度,从而挑选出最优的推荐结果。这就带来了问题:对于大规模商品候选集的场景是计算不可行的。


如何化解计算不可行的问题?研究人员提出了以向量距离的方式衡量用户和商品兴趣度的方法,用户和商品被表示成向量形式,并以此为基础建立基于向量聚类的索引结构进一步加速衡量效率,于是这个计算问题变成了在有限时间内是可解的(近似求解),具体实现也落到了向量引擎的范畴。结合公式(1),T代表简单的向量内积计算时间,而N则通过建立向量索引结构从而控制在O(桶候选集规模)的较小范围内。


所以内积式模型和向量引擎成为了最近几年匹配领域技术革新的最重要技术(图像检索问题最早就是采用的这种方法)。尤其是去年Facebook的Faiss框架开源,极大降低了业界尝试向量引擎的难度,对行业发展起到了极大的促进作用。至此,基于内积模型的向量检索方法引领了第二代匹配和推荐技术的潮流,在各类学术会议和工业实践中大放异彩。


然而问题是,这类方法并未实现充分利用机器学习解决匹配问题的初衷,对机器学习模型的限制太大。高阶深度学习大部分都不可划成内积形式,比如CTR预估里用户和商品特征交叉非常有用,大部分不可用内积表示。而在现有深度学习中内积模型的表达能力被证明是有限的,比如将内积模型中最后的内积运算直接换成多层感知机能大幅提升模型能力,而多层PNN(概率神经网络),DIN等对用户兴趣更有洞察力的复杂模型效果被证明能极大的超越内积模型。


与此同时,我们也发现在具体实践中,向量检索算法要求User和Item能够映射到统一的向量空间。User输入信息和Item输入信息一般并不同质,如何保证映射到统一目标向量空间下的检索精度对映射算法提出了严格的要求,换言之,统一的向量空间映射对运用向量检索来解决推荐问题带来了精度损失的风险。

 

III)下一代匹配和推荐技术


  • 1
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值