跨模态搜索(cross-modal/media retrieval)

1、实验基本信息


        跨模态搜索研究的基本内容是寻找不同模态样本之间的关系,实现利用某一种模态样本,搜索近似语义的其他模态样本。

本文实现了论文《Joint Feature Selection and Subspace Learning for Cross-Modal Retrieval》(PAMI2016)和论文《Simple to Complex Cross-modal Learning to Rank》(arxiv.org 2017.2)。并对实现的结果进行了一些讨论。


2、算法内容
2.1 论文《Joint Feature Selection and SubspaceLearning for Cross-Modal Retrieval》(JFSSL)(PAMI2016)

代码连接:https://github.com/2012013382/JFSSL-Cross-Modal-Retrieval
       此论文是对于论文《Spectral Regression for Efficient Regularized Subspace Learning》(ICCV2007)和论文《L21Regularized Correntropy for Robust Feature Selection》的结合。其主要的目的是为了最优化目标函数(1)。


        其中,M为模态的类别数,在此,我们只考虑图片和文本之间互相搜索的情况,因此M=2;Up表示对应模态的映射矩阵;Xp表示输入的训练样本;Y表示样本的标签;第三项为模态间/模态内相似度函数;lambda1和lambda2为两个设定的阈值。

       最优化这个目标函数的目的就是为了得到映射矩阵Up。通过映射矩阵,便可以将不同模态的特征数据映射到相同的子空间中,再通过cosine相似度度量,即可得到不同模态数据之间的相似度。

        可以看到,整个式子分为三个部分,其中最主要的是第一个部分。

       如公式(2)所示,它的形式是一个基本的均方误差,最小化这个均方误差,便可以使得映射矩阵朝着理想的方向变化。
       公式( 1) 的第二项为一个 L2,1 范数约束项,
  • 5
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 17
    评论
### 回答1: 深度模态哈希化是一种将不同模态的数据(如图像和文本)映射到低维二进制编码的技术。这种哈希化方法可以用于模态检索和多模态数据分析等任务。深度模态哈希化通常使用深度神经网络来学习数据的表示,并使用损失函数来优化哈希函数。 ### 回答2: 深交叉模态哈希(Deep Cross-Modal Hashing)是一种用于模态查询的哈希方法,主要应用于大规模多媒体数据检索的场景。它可以将不同类型的信息(如图像、文本和视频)编码为紧凑的二进制哈希码,使得哈希码能够在不同模态间保持高质量的相似性。 深交叉模态哈希主要基于深度学习技术实现。通过对不同模态的数据进行编码,使得它们能够在一个统一的空间中表示,并且在该空间内距离越近的点越相似。这样,在哈希过程中,将这些点映射到二进制码空间时,距离较近的点将有更高的概率被映射到相同的哈希编码。这种方法可以提高哈希效率、压缩数据量、降低存储成本及提高检索速度。 在实践中,深交叉模态哈希被广泛应用于图像检索、视频检索和文本检索等领域。通过该方法,可以快速地检索出与查询相关的相似数据,并可以根据哈希码相似度进行排序和筛选。同时,深交叉模态哈希还可以将不同模态的数据相互转化,例如将文本转化为图像,从而在不同领域之间进行有益的交互。相信未来,随着深度学习技术的不断发展,深交叉模态哈希将会有更加广泛的应用。 ### 回答3: 深度交叉模态哈希(deep cross-modal hashing)是一种将多模态数据(如图像、文本、音频等)进行哈希编码的方法。该方法通过将多个模态数据输入到一个深度神经网络中,学习到一个交叉模态表示,然后使用该表示生成哈希编码。相比传统的单模态哈希方法,深度交叉模态哈希能够有效地利用多模态数据之间的关联,提高哈希编码的质量和准确性。 深度交叉模态哈希的具体实现方法通常分为以下几步骤: 1. 多模态数据处理 将多模态数据(如图像、文本、音频等)输入到网络中进行处理,通常使用卷积神经网络或循环神经网络来提取数据的特征。 2. 交叉模态表示学习 将多模态数据提取的特征输入到一个共享的交叉模态表示学习网络中进行训练,该网络将不同模态之间的信息进行交叉融合,并学习到一个交叉模态表示。 3. 哈希编码生成 使用学习到的交叉模态表示生成哈希编码,通常使用如余弦相似度等方法来量化哈希编码的相似度。 深度交叉模态哈希的优点在于能够有效地利用多模态数据之间的相关性,同时可以保留数据的原始特征,有利于后续的数据处理和应用。但是由于网络结构较为复杂,训练和计算成本较高,且对输入数据的质量和数量有一定要求,因此在实际应用中仍需考虑多方面因素。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 17
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值