一、比赛介绍
移动互联网时代的开启使得图片的获取与分享越来越容易,图片已经成为人们交互的重要媒介。如何根据据图像的视觉内容为图像赋予一个语义类别(例如,教室、街道等)是图像场景分类的目标,也是图像检索、图像内容分析和目标识别等问题的基础。但由于图片的尺度、角度、光照等多样性以及场景定义的复杂性,场景分类一直是计算机视觉中的一个挑战性问题。
本次比赛从400万张互联网图片中精选出8万张图片,分属于80个日常场景类别,例如航站楼、足球场等。每个场景类别包含600-1100张图片。本次比赛要求参赛选手根据图片场景数据集建立算法,预测每张图片所属的场景类别,组委会将通过计算参赛者提交预测值和场景真实值之间的误差确定预测正确率,评估所提交的预测算法。
二、赛题与数据
移动互联网时代的开启使得图片的获取与分享越来越容易,图片已经成为人们交互的重要媒介。如何根据图像的视觉内容为图像赋予一个语义类别(例如,教室、街道等)是图像场景分类的目标,也是图像检索、图像内容分析和目标识别等问题的基础。但由于图片的尺度、角度、光照等因素的多样性以及场景定义的复杂性,场景分类一直是计算机视觉中的一个挑战性问题。
本次比赛从400万张互联网图片中精选出8万张图片,分属于80个日常场景类别,例如航站楼、足球场等。每个场景类别包含600-1100张图片。本次比赛要求参赛选手根据图片场景数据集建立算法,预测每张图片所属的场景类别,组委会将通过计算参赛者提交预测值和场景真实值之间的误差确定预测正确率,评估所提交的预测算法。详细的场景类别id和中英文名称见表格1。[1][2][3]
数据集分为训练(70%)、验证(10%)、测试A(10%)与测试B(10%)四部分。
训练标注数据包含照片id和所属场景类别标签号。训练数据文件与验证数据文件的结构如下所示:
[
{
"image_id":"5d11cf5482c2cccea8e955ead0bec7f577a98441.jpg",
"label_id": 0
},
{
"image_id":"7b6a2330a23849fb2bace54084ae9cc73b3049d3.jpg",
"label_id": 11
},
...
]
我们提供场景类别标号与场景中英文名称对照,文件结构如下: