数据来自2017 AI Challenger,数据集对给定的每一张图片有五句话的中文描述。数据集包含30万张图片,150万句中文描述。训练集:210,000 张,验证集:30,000 张,测试集 A:30,000 张,测试集 B:30,000 张。
官网
https://ai.chuangxin.com/ai_challenger
下载
百度网盘: https://pan.baidu.com/s/1g1XaPKzNvOurH9M44p1qrw 提取码: bag3
百度网盘: https://pan.baidu.com/s/1m-yFj6ST2KJlx7D77de6DQ 提取码: CPRK
谷歌网盘:https://drive.google.com/open?id=0ByB0MjjNghlyNkdhR3lIZGJneGM
参考链接
https://dataware.cc/ai-challenger-caption/
https://github.com/AIChallenger/AI_Challenger_2017/issues/42
https://github.com/wangheda/ImageCaption-UnderFitting/blob/master/README.md
https://www.arxiv-vanity.com/papers/1711.06475/