简介
本文提出了一个新任务——Group Captioning,就是在一堆图片中,对特定的几个图片生成caption,生成的caption要具备选定的图片的特性,且不包含其他未选定的图片的特性。
下载链接
动机
现有方法都只侧重于单张图片的captioning,而现实世界中,往往需要分组描述。
贡献
- 提出一个新的task——group captioning。
- 提出了一种learning based的学习一组图像特征的方法。
- 提出了新的数据集——Stock Captions。
方法
数据集构造方法:
本文方法:
实验
实验结果: