TDM检索技术讲解

transformer_WSZ

于 2024-02-27 02:19:47 发布

阅读量933

点赞数 20

分类专栏：搜广推文章标签： TDM 召回

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/transformer_WSZ/article/details/136311875

版权

搜广推专栏收录该内容

12 篇文章 0 订阅

订阅专栏

阿里TDM通过构建树索引降低召回检索时间复杂度，利用embedding提升模型表达，采用二叉树结构和联合训练方法，结合复杂模型与k-means聚类，实现实时商品推荐。

摘要由CSDN通过智能技术生成

召回的任务是从海量商品库中挑选出与用户最相关的topK个商品。传统的召回检索时间复杂度是 $O (N)$ ，而阿里的TDM通过对全库商品构建一个树索引，将时间复杂度降低到 $O (l o g N)$ 。

模型概览

model

树的每个节点输入到左侧复杂模型的时候，都是一个embedding，这样user向量和item向量可以提早交互，提升模型表达能力。

在树的每一层采用beam search的方式采样出topK个结点，到了最后一层叶子节点的时候，即可得到topK个商品。

联合训练

model

初始化二叉树：首先借助商品的类别信息进行排序，将相同类别的商品放到一起，然后递归的将同类别中的商品等量的分到两个子类中，直到集合中只包含一项，即最终的具体商品
基于树模型生成样本：如果用户点击了某个item，那么从根节点到该叶子节点上的所有节点（不包含根节点）都是正样本，而在每一层的节点中进行随机负采样
训练上图的复杂模型直至收敛
基于复杂模型得到所有叶子节点的embedding，迭代地进行k-means聚类。每迭代一次，生成一层中间树节点。需要注意如下如下两点：
- 训练得到的中间节点embedding在聚类过程中是不使用的，只用到叶子节点embedding
- 在线上serving的时候，中间节点embedding会输入到模型中得到topK个结点，每一层下去得到topK个商品
重复2~4过程

上述的步骤，至始至终都是在训练一个模型，而不是每一层一个模型（或者每棵树一个模型）

参考

transformer_WSZ

关注

20
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
TDM检索技术讲解

召回的任务是从海量商品库中挑选出与用户最相关的topK个商品。传统的召回检索时间复杂度是ON，而阿里的TDM通过对全库商品构建一个树索引，将时间复杂度降低到OlogN。more。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。