论文笔记:Aligning where to see and what to tell: image caption with region-based attention ...

Aligning where to see and what to tell: image caption with region-based attention and scene factorization

rXiv:1506.06272v1  [cs.CV]  20 Jun 2015


摘要部分:


本文提出一种图像文字标注系统利用了图像与句子之间的平行结构

下面翻译的不好,附原文

In our model, the process of generating the next word, given the previously generated ones, is aligned with the visual perception experience where the attention shifting among the visual regions imposes a thread of visual ordering. This alignment characterizes the flow of “abstract meaning”, encoding what is semantically shared by both the visual scene and the text description. Our system also makes another novel modeling contribution by introducing scene-specific contexts that capture higher-level semantic information encoded in an image. The contexts adapt language models for word generation to specific scene types.

在该模型中,在给定前一个生成的词情况下产生下一个词的过程中, 与视觉感知信息体验对齐, 该视觉感知体验位于在视觉区域之间移动注意力时产生的一连串视觉顺序该对齐刻画了‘抽象含义’流,对同时被视觉场景和文字描述在语义上共享的信息编码
通过引入特定场景上下文,俘获图像中高级语义信息编码,本系统提出了另一种新模型。
该上下文自适应语言模型以便针对特定场景类型生成词。


接下来作者鼓吹效果.....



占位,持续更新ing

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值