我最近在研究图文多模态的公开数据集,本文总结了图文多模态常用的公开数据集。这里没有记录小数据集(不到2千张图级别的,有较高引用的有 IAPS 和 GAPED,微博)和 与业务相关性低的(艺术场景,如 ArtPhoto)。
任务 | 数据集 | 论文 | 中文or 英文 |
---|---|---|---|
图文情感分类 | Yelp | VistaNet | 英文 |
图文情感分类 | Tumblr | Fine-grained Video-Text Retrieval with Hierarchical Graph Reasoning | 英文 |
图片情感分类 | FlickrLDL, TwitterLDL | Learning visual sentiment distributions via augmented conditional probability neural network | 英文 |
图片情感分类 | emotion6 | Building a Large Scale Dataset for Image Emotion Recognition: The Fine Print and The Benchmark | 英文 |
图片情感分类 | Multi-ZOL | Multi-Interactive Memory Network for Aspect Based Multimodal Sentiment Analysis | 中文 |
电商图文检索 | MUGE | Wukong | 中文 |
图文检索 |