跨模态检索Coupled CycleGAN: Unsupervised Hashing Network for Cross-Modal Retrieval

核心思想

   本论文是无监督方法,主要由两层循环对抗网络构成,外层的循环对抗网络主要是使不同模态提取更有代表性的公共特征向量,内层循环对抗网络使学的高质量的哈希编码。

  外层循环对抗网络:
过程描述:图像通过卷积提取特征作为 F r e a l I F_{real}^I FrealI,然后通过生成器 G f I − > T G_f^{I->T} GfI>T(是一个encode->decode过程),生成 F f a k e I F_{fake}^I FfakeI作为真实文本特征对应的假数据, F f a k e T F_{fake}^T FfakeT F r e a l T F_{real}^T FrealT作为抗网络的正假数据来训练网络( D f T D_f^T DfT),消除图像和文本的差距。同理图像通过 G f T − > I G_f^{T->I} GfT>I(是一个encode->decode过程)生成的 F f a k e I F_{fake}^I FfakeI作为真是图像对应的假数据。 F f a k e I F_{fake}^I FfakeI F r e a l I F_{real}^I FrealI作为抗网络的正假数据来训练网络( D f I D_f^I DfI),消除图像和文本的差距。同时 F f a k e T F_{fake}^T FfakeT F f a k e I F_{fake}^I FfakeI分别通过 G f T − > I G_f^{T->I} GfT>I G f I − > T G_f^{I->T} GfI>T生成向量分别与 F r e a l I F_{real}^I FrealI F r e a l T F_{real}^T FrealT构成损失函数,进一步消除模态之间的差异。
  内层循环对抗网络:与外层循环对抗网络的思想相似。

网络结构图

在这里插入图片描述

损失函数

外层对抗网络损失函数:
  总的损失函数:
在这里插入图片描述
  展开:
对抗网络损失函数:
在这里插入图片描述
重建损失函数:
在这里插入图片描述
相似性损失函数:
在这里插入图片描述

内层对抗网络损失函数:
总的损失函数:
在这里插入图片描述
对抗损失函数:
在这里插入图片描述
重建损失函数:
在这里插入图片描述
相似损失函数:
在这里插入图片描述

创新点和缺点

创新点:通过循环对抗网络消除不同模态之间的差异。
缺点:指考虑了相似性,没有考虑不相似性(缺少rank信息),同时重建损失函数里,将提取特征换成重建特征会不会更好些呢???

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值