计算机视觉论文
小猿外
一起见证小猿外的成长吧~
展开
-
Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering 论文精简翻译
摘要 自顶向下的视觉注意机制已广泛应用于image caption 和 VQA 中。我们提出了一个自底向上和自顶向下相结合的注意力机制,使注意力能够在物体和其他突出的图像区域的水平上进行计算。在我们的方法中,自底向上的机制(基于Faster R-CNN)提取图像区域,每个区域有一个对应的特征向量,而自顶向下的机制确定特征权重。用这个模型我们获得了2017年VQA挑战赛的第一名。 1.介绍 视觉注意...原创 2020-03-01 18:34:37 · 706 阅读 · 0 评论 -
用引导对象生成图像描述(Intention Oriented Image Captions with Guiding Objects 翻译)
论文来自CVPR2019 论文地址: https://ieeexplore.ieee.org/document/8954294/ 用引导对象生成图像描述 概要 虽然现有的图像描述模型可以使用递归神经网络(RNNs)达到预期的结果,但很难保证我们关心的对象包含在生成的描述中,例如在图像中不明显的对象。当我们关注的对象没有参与训练时,问题变得更加复杂。...原创 2020-03-01 18:33:37 · 829 阅读 · 0 评论