1.introduction
引入caption generation问题,重要但是难以解决。
现阶段的解决方法:基于大数据和神经网络提取图片中的特征,然后用rnn解码为自然语言句子
将显著的top layer feature和作为补充的low-level representation结合是一个难点
本文的贡献如下:(论文内容概括)
2.related work
介绍业界水平、学术界论文、思想
3.用Attention Mechanism解决caption generation
3.1先介绍Attention Mechanism的两个变体的共同框架
我们用粗体字体表示向量,用大写字母表示矩阵 // We denote vectors with bolded font and matrices with capital letters