Deep Supervised Cross-modal Retrieval

最新推荐文章于 2022-10-06 16:35:06 发布

HYY233

最新推荐文章于 2022-10-06 16:35:06 发布

阅读量1.4k

点赞数 2

分类专栏：文献阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HYY233/article/details/103530570

版权

文献阅读专栏收录该内容

9 篇文章 1 订阅

订阅专栏

Deep Supervised Cross-modal Retrieval

Liangli Zhen∗ Peng Hu∗ Xu Wang Dezhong Peng†

解决问题：在不同模态下，样本生成可以直接比较的公共表示空间。不仅保证了公共空间各模态数据与标签的相似性，而且保证了语义区分和公共空间模态的不变性，可以有效地学习异构数据的公共表示。

主要思想：VGG-19提取图像特征，Word2Vec，CNN提取文本特征，创建线性分类器对样本生成标签，在标签空间和公共表示空间下最小化区别损失，同时，最小化两种模态在公共表示空间中所有样本的识别损失来学习多模态不变特征，为了消除跨模态数据差异，将所有图像到文本对之间的表示距离最小化。

创新点：(1)提出了一种基于深度监督的跨模态学习结构，以弥补不同模式间的异质性。通过端到端方式，同时保证语义区分和模态不变性，可以有效地学习异构数据的公共表示。(2)为了研究图像和文本模态之间的跨模态相关性，在最后一层建立了两个具有权值共享约束的子网络。将模态不变性损失直接表示为目标函数，消除了模态间的差异。(3)利用线性分类器对公共表示空间中的样本进行分类。这样，DSCMR最大限度地减少了标签空间和公共表示空间的区分损失，使得学习的公共表示具有显著的区分性。

相关代码：https://github.com/penghu-cs/DSCMR

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Deep Supervised Cross-modal Retrieval

Deep Supervised Cross-modal RetrievalLiangli Zhen∗ Peng Hu∗ Xu Wang Dezhong Peng†解决问题：在不同模态下，样本生成可以直接比较的公共表示空间。不仅保证了公共空间各模态数据与标签的相似性，而且保证了语义区分和公共空间模态的不变性，可以有效地学习异构数据的公共表示。主要思想：VGG-19提取图像特征，Word2...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。