双塔模型1之模型和训练

学会歌唱的老周

已于 2025-03-27 09:02:30 修改

阅读量436

点赞数 4

分类专栏： # 王树森推荐系统公开课学习笔记文章标签：推荐算法算法双塔模型召回模型 pairwise Pointwise Listwise

于 2025-03-25 08:57:34 首次发布

本文链接：https://blog.csdn.net/zhouwenxing666/article/details/146493153

版权

9 篇文章

订阅专栏

双塔模型：模型和训练

双塔模型可以看作矩阵补充的升级版，用户物品向量中考虑了其他属性，且最后用余弦相似度表示用户对物品的感兴趣程度（两向量之间夹角的余弦值，取值范围[0,1]）

Pointwise是最简单的训练方式，它把召回看做二元分类任务。

基本想法：让cos(a,b+) > cos(a,b-)，且二者差越大越好

损失函数

训练的过程就是对损失函数求最小化，用梯度更新神经网络的参数

Listwise训练每次取一个正样本（如用户的历史记录显示用户喜欢这个样本）和多个负样本

一条数据包含:

一个用户，特征向量记作a。
一个正样本，特征向量记作 b+
多个负样本，特征向量记作 b1-,…,bn-

不适合用于召回的模型

下面这种结构是前期融合的模型，前期融合的模型一般就是粗排或精排的模型。召回模型一般是后期融合模型。

原因如下：

这种神经网络属于前期融合，在进入全连接层之前就把特征向量拼起来了。而双塔模型属于后期融合，两个塔在最终输出相似度的时候才融合起来
假如把这种模型用于召回，就必须把所有物品的特征都挨个输入模型，预估用户对所有物品的兴趣。假如有一亿个物品，每给用户做一次召回，需要跑一亿次模型，计算量太大且无法用近似最近邻查找加大计算。
这种模型适用于排序，从几千个物品中选出几百个，计算量不会太大