ICCV 2019 image-text相关论文总结

ICCV 2019 image-text相关论文总结

1. Local Relation Networks for Image Recognition

issue: CNN用固定的filters来提取image feature,但image的空间分布是多变的,不能很好的满足image不同的空间分布。
method: 提出local relation layer,用于改进CNN。通过局部区域的关系(relationship)来计算每个local的权重,从而来融合特征。

2. Visual Semantic Reasoning for Image-Text Matching

issue: image-text matching的语义gap问题,image的表示缺乏全局的语义内容信息。

mehtod: 利用reason model来生成包含关键object和语义信息的visual representation。先建立image regions之间的关系,之后利用GCN生成语义关系的特征,在此基础上利用门机制和memory机制来生成全局的语义特征。如图,这样提取的特征即包含了key object(caption中的框框部分)又包含语义信息(caption中的highlight)。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值