1 致谢
感谢于教授给我发的几篇论文,感到打开了一个新世界!
2 前言
今天在学习 Cross-Modal Retrieval~
在看文章的时候,看到有些比较新的文章是用GAN来做 Cross-Modal Retrieval,感觉到很奇怪,
为什么跨模态检索要用到GAN呢?
从我的直觉看来,不是只要生成合适的本征向量表示两种模态之间的距离就行了吗?
为啥要要用GAN模型呢?
然后在网上查找了一下资料,发现是存在这样一个距离,那就是,
如何找到一个特征子空间,使得具有不同标签的两个Object,不同模态的数据在特征子空间的表示具有可分性;而对于同一个Object,在不同模态下的数据在特征子空间的表示是不具有可分性的(或者说是基本一样的);
那么这个特征空间的映射器,我们就把它理解为GAN中的生成模型;