深度学习（二）：Deep Supervised Cross-modal Retrieval

最新推荐文章于 2022-10-06 16:35:06 发布

qq2285580599

最新推荐文章于 2022-10-06 16:35:06 发布

阅读量747

点赞数

分类专栏：深度学习_监督_跨模态检索

本文链接：https://blog.csdn.net/qq2285580599/article/details/110791061

版权

10 篇文章 1 订阅 ¥99.90 ¥299.90

订阅专栏

本文介绍了深度监督跨模态检索（DSCMR）方法，该方法在公共表示空间中利用语义和分类信息，确保模态间的不变性和语义辨别性，以提高跨模态检索的性能。通过对标签和模态不变性的联合优化，DSCMR解决了异构数据表示学习的挑战。

摘要由CSDN通过智能技术生成

Deep Supervised Cross-modal Retrieval，CVPR 2019

Motivation

值得注意的是，即使分类信息已被用于一些深度学习方法，分类信息仅用于学习每一模态内部或模态间的可区分特征。语义信息（语义信息我在这里理解成公共空间到标签的映射）在这些跨模态学习方法中没有得到充分的利用。

DSCMR同时最小化模态不变性损失，并采用权值共享策略在公共表示空间中学习模态不变性特征，为了保证学习的表示法在语义结构上具有辨别性，并且在模态间具有不变性，对两两标签信息和分类信息都尽可能地进行了充分的演绎。

学习这种常见表示空间的方法有多种，大致可分为两类: 1)二值表示学习，也称为交叉模态哈希; 2)实值表示学习。由于所述表示被编码为二进制码，因此由于信息的丢失，检索

了解本专栏

关注

专栏目录