【CVPR2022】语言引导与基于视觉的深度度量学习的集成

9c9a5b123161292c07328c25f933e0ab.png

来源:专知
本文为论文,建议阅读5分钟我们提出了一种视觉相似度学习的语言指导目标。

e4f7c0497af8851b604092d479ca46a8.png

深度度量学习(Deep Metric Learning, DML)提出学习度量空间,将语义相似性编码为嵌入空间距离。这些空间应该可以转移到训练期间看到的类别之外。通常,DML方法使用任务网络来解决在二元类分配上定义的对比排序任务。然而,这种方法忽略了实际类之间的高级语义关系。这导致学习后的嵌入空间编码不完整的语义上下文,并歪曲类之间的语义关系,影响了学习后的度量空间的泛化性。为了解决这一问题,我们提出了一种视觉相似度学习的语言指导目标。利用专家类名和伪类名的语言嵌入,我们根据有意义的语言语义对视觉表示空间进行上下文化和重新对齐,以获得更好的语义一致性。大量的实验和消融为我们提出的方法提供了强大的动力,并显示语言指导为DML提供了显著的、模型无关的改进,在所有基准上实现了具有竞争力的和最先进的结果。代码可在

https://github.com/ExplainableML/LanguageGuidance_for_DML获得。

1f4aed7546b8784477d9235154b0a6eb.png

c5bf0b2b6c5ff0b1550661595fc056c6.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值