目录 一、贡献二、实验1.实验内容2.实验结果 总结 一、贡献 提出数据集 TextCaps 主要用于图像中的文字识别 应用场景 imagecaption VQA 二、实验 1.实验内容 分别在 BUTD、AoANet、M4C模型进行实验 2.实验结果 总结 当前先进的image caption并不能适用该数据集