论文笔记
文章平均质量分 78
Jamiechoi
这个作者很懒,什么都没留下…
展开
-
论文笔记:Hierarchy Parsing for Image Captioning
基于层次分析的图像描述作者:蔡文杰单位:华南理工大学研究方向:计算机视觉论文链接:Hierarchy Parsing for Image CaptioningIntroduction目前大多数的image captioning模型采用的都是encoder-decoder的框架。本文在encoder的部分加入了层次分析(HIerarchy Parsing,HIP)结构。HIP首先把图片...原创 2020-03-04 17:50:59 · 1041 阅读 · 0 评论 -
论文笔记:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering
论文链接:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question AnsweringBottom-Up Attention Model本文的bottom up attention 模型在后面的image caption部分和VQA部分都会被用到。这里用的是object detection领域的Faster R原创 2017-11-03 15:26:16 · 17391 阅读 · 6 评论 -
论文笔记:Self-critical Sequence Training for Image Captioning
论文链接:Self-critical Sequence Training for Image Captioning引言现在image caption主要存在的问题有:exposure bias:模型训练的时候用的是叫“Teacher-Forcing”的方式:输入RNN的上一时刻的单词是来自训练集的ground-truth单词。而在测试的时候依赖的是自己生成的单词,一旦生成得不...原创 2017-11-29 15:11:44 · 13371 阅读 · 2 评论 -
论文笔记:Image Captioning with Semantic Attention
论文链接:Image Captioning with Semantic Attention框架与普通的image Caption框架相比,论文从图片中提取了visual attribute(实际上就是一些单词),并把这些attribute结合进了input跟output attention model里面。整个框架的公式如下:x0=ϕ0(v)=Wx,vvx0=ϕ0(v)...原创 2017-10-17 15:23:58 · 4835 阅读 · 3 评论 -
论文笔记:Knowing When to Look: Adaptive Attention via A Visual Sentinel for Image Captioning
论文链接:Knowing When to Look: Adaptive Attention via A Visual Sentinel for Image CaptioningIntroduction目前大多数的基于attention机制的image captioning模型采用的都是encoder-decoder的框架。然而在decode的时候,decoder应该对不同的词有不同...原创 2018-03-03 15:49:13 · 9157 阅读 · 3 评论 -
论文笔记:Contrastive Learning for Image Captioning
原文链接:Contrastive Learning for Image CaptioningIntroduction本文的提出的Contrastive Learning (CL) 主要是为了解决Image Caption任务中生成的Caption缺少Distinctiveness的问题。这里的Distinctiveness可以理解为独特性,指的是对于不同的图片,其caption...原创 2018-01-31 22:45:05 · 4857 阅读 · 1 评论