Joint Learning of Deep Retrieval Model and Product Quantization based Embedding Index

Joint Learning of Deep Retrieval Model and Product Quantization based Embedding Index

嵌入索引能够实现快速近似近邻搜索,是目前最先进的深度检索系统不可缺少的组成部分。传统的检索方法往往将嵌入学习和建立索引两个步骤分离,增加了建立索引的时间,降低了检索的准确性。本文提出了一种基于乘积量化的嵌入指标与深度检索模型联合训练的新方法——Poeem,利用梯度直通式估计器、热启动策略和深度检索模型等技术,将两个单独的步骤统一到一个端到端训练中。最优空间分解和吉文斯旋转。大量实验结果表明,该方法不仅显著提高了检索精度,而且索引时间几乎为零。为了便于比较和再现,我们将方法开源。

背景

embidding  indexi 的缺点主要问题在于模型训练与索引建立的分离,导致索引建立时间增加,检索精度下降。

量化方法缺点:1)量化步骤作为基于PQ的嵌入指标的核心,具有不可微分的操作,如参数min,使标准的反向传播训练失效。因此,我们利用梯度直通估计器绕过不可微性,以实现端到端训练。2)量化质心随机初始化导致质心分配非常稀疏,参数利用率较低,量化失真较高  3)标准优化乘积量化(OPQ)[9]算法通过正交矩阵对空间进行旋转,进一步降低PQ失真,不能与联合模型一起迭代运行

2 Method

2.1 Revisiting Retrieval Model

一个标准的嵌入检索模型由查询塔𝑄和项目塔𝑆组成。因此,对于一个给定查询𝑞和一个条目𝑠

然而,这个额外的步骤不仅花费额外的时间来建立索引,而且还会导致召回率的下降

2.2 Embedding Indexing Layer

索引层定义一个完整的量化函数T: R𝑑−→R𝑑映射输入嵌入x输出嵌入T (x),它可以分解为四个功能:粗量化函数𝜓,乘积量化函数𝜙和解码器𝜌函数,与一个正交矩阵𝑅和旋转功能

The coarse quantization function 𝜓

R𝑑→{1,···,𝐽},通过粗质心矩阵v∈R𝐽×𝑑将连续向量x映射到𝐽-way离散粗代码𝑟

The product quantization (PQ) function 𝜙

R𝑑−→{1,···,𝐾}𝐷,将上述剩余向量y映射为𝐾-way𝐷-dimensional

The decoder function

The rotation function

2.3 Training Algorithm

在这里,我们提出通过调整Eq.(6)中的原始量化函数T来利用梯度直通估计量[2],如下所示

我们在损失函数中加入一个正则项来最小化量化失真,如下:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
自然语言和视觉连接是一种研究方法,旨在通过语言和图像的融合,改进车辆检索系统。这种方法利用了自然语言处理和计算机视觉的技术,以实现更准确和智能的车辆检索。 在过去的几年中,对于车辆拍摄的图像进行自动检索的研究得到了迅速的发展。传统的车辆检索方法主要基于图像中的颜色、纹理和形状等视觉特征。然而,这些方法往往存在局限性,无法捕捉到车辆的更细致特征,也无法解决语言和图像之间的关联问题。 自然语言和视觉连接的研究方法通过融合语言和图像的信息,使车辆检索系统具备了更强的智能化能力。该方法首先通过自然语言处理技术,将用户的描述或查询翻译成机器可理解的语义表示。然后,利用计算机视觉技术,对图像进行分析和处理,提取出视觉特征。最后,将语义表示和视觉特征进行匹配,以实现车辆检索。 这种连接语言和视觉的方法可以克服传统车辆检索方法的局限性,实现更准确和智能的车辆检索。通过语言的引导,系统能够更好地理解用户的查询意图,并从图像中精确地捕捉到车辆的特征。同时,通过与视觉信息的融合,系统能够提供更全面和准确的搜索结果,提高了检索的准确性和效率。 总而言之,连接语言和视觉的研究方法为自然语言驱动的车辆检索系统的发展带来了新的机遇。这种方法通过融合语言和图像信息,提高了车辆检索的准确性和智能化程度,为用户提供更好的检索体验。随着自然语言处理和计算机视觉技术的不断进步,我们相信连接语言和视觉的车辆检索方法将在未来取得更多的突破和应用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值