数据主页:http://bvisionweb1.cs.unc.edu/ilsvrc2015/download-videos-3j16.php#vid
Object detection from video
视频中的目标检测,简称VID。目前官方已经完全开放了数据集包括3862 snnipets用于训练,555 snippets用于验证, 937 snippets用于测试。数据下载地址:http://bvisionweb1.cs.unc.edu/ilsvrc2015/ILSVRC2015_VID.tar.gz。所有的snippet包括56~458帧图像。
视频中的目标检测,类似目标检测任务的风格。该任务有30个基本类别,是目标检测任务200个基本类别的子集。这些类别都是精心选择的,考虑到不同因素,如运动类型,视频背景干扰,平均目标数目等。所有类别在每个帧都完全打标签。官方使用了Datatang的服务来标记目标框。
30个类别为:
n02691156 1 airplane
n02419796 2 antelope
n02131653 3 bear
n02834778 4 bicycle
n01503061 5 bird
n02924116 6 bus
n02958343 7 car
n02402425 8 cattle
n02084071 9 dog
n02121808 10 domestic_cat
n02503517 11 elephant
n02118333