数据集下载地址:http://bvisionweb1.cs.unc.edu/ilsvrc2015/ILSVRC2015_VID.tar.gz
总说:
数据集包括3862 snippets用于训练,555 snippets用于验证,937 snippets用于测试。
每个snippet包括56~458帧图像不等。
视频中的目标检测,类似目标检测任务的风格。该任务有30个基本类别,是目标检测任务200个基本类别的子集。这些类别都是精心选择的,考虑到不同因素,如运动类型,视频背景干扰,平均目标数目等。所有类别在每个帧都完全打标签。
30个类别为:
n02691156 1 airplane 飞机
n02419796 2 antelope 羚羊
n02131653 3 bear 熊
n02834778 4 bicycle 自行车
n01503061 5 bird 鸟
n02924116 6 bus 公交
n02958343 7 car 小汽车
n02402425 8 cattle 牛
n02084071 9 dog 狗
n02121808 10 domestic_cat 猫
n02503517 11 elephant 大象
n02118333 12 fox 狐狸
n02510455 13 giant_panda 熊猫
n02342885 14 hamster 仓鼠
n02374451 15 horse 马
n02129165 16 lion 狮子
n01674464 17 lizard 蜥蜴
n02484322 18 monkey 猴子
n03790512 19 motorcycle 摩托车
n02324045 20