![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
图文跨模态检索
文章平均质量分 80
qq_24876435
这个作者很懒,什么都没留下…
展开
-
Vision GNN:An Image is Worth Graph of Nodes
ViG原创 2022-06-11 16:07:47 · 1331 阅读 · 3 评论 -
Improving description-based person-identification by multi-granularity image-text alignments-2019TIP
通过多粒度图像文本对齐改进基于描述的行人重识别摘要:基于描述的行人重识别是视频监控中的一项重要任务,需要有区别性的跨模态表征来区分不同的人。由于模态的异质性(交叉模态问题),直接测量图像和描述文本之间的相似性是困难的,并且所有的样本属于单个类别(细粒度问题)使得这个任务比传统的图像描述匹配任务更加困难。本文提出了一种多粒度图像-文本对齐(MIA)模型,以解决基于描述的行人重识别的交叉模态细粒度问题。具体来说,有三种不同的粒度,即全局-全局、全局-局部和局部-局部对齐是分层次进行的。首先,全局对比(GC)原创 2022-03-23 16:00:44 · 3511 阅读 · 0 评论 -
A Cross-Modal Image and Text Retrieval Method Based on Efficient Feature Extraction and Interactive
基于有效特征提取和交互学习的跨模态图像文本检索2022年 Scientific Programming摘要:针对多模态环境的复杂性和现有浅层网络结构无法实现高精度的图文检索,提出一种结合高效特征提取和交互式学习卷积自动编码器CAE的跨模态图像和文本检索方法。首先,改进残差网络卷积核,引入二维主成分分析提取图像特征,通过长短时记忆网络LSTM和词向量提取文本特征,高效提取图特征。基于交互式学习CAE,实现了图像和文本的跨模态检索。其中,图像和文本特征分别输入双模式CAE的两个输入端,通过中间层的...原创 2022-03-11 22:05:29 · 4533 阅读 · 0 评论 -
Intra-class low-rank regularization for supervised and semi-supervised cross-modal retrieval
原文链接:Intra-class low-rank regularization for supervised and semi-supervised cross-modal retrieval | SpringerLink监督和半监督的跨模态检索类内低秩正则化摘要:跨模态检索旨在跨不同模态检索相关项,例如,使用图像查询来检索相关文本。现有的深度方法在融合多种模态时忽略了模态内和模态间的类内低秩结构,降低了检索性能。本文提出了两种基于类内低秩正则化的深度模型,分别用于监督和半监督跨模态检索. 具体来原创 2022-03-10 21:58:06 · 2219 阅读 · 0 评论