ILSVRC2015_VID数据集说明

参考Bolg:ILSVRC2015_VID数据集详解_lighten-1996的博客-CSDN博客_ilsvrc2015

数据主页:ImageNet Large Scale Visual Recognition Competition 2015 (ILSVRC2015)

数据下载:http://bvisionweb1.cs.unc.edu/ilsvrc2015/ILSVRC2015_VID.tar.gz

目录

一、基本信息

二、压缩包详细结构

1.压缩包

2.压缩包解压后

3.ILSVRC2015包含3个文件夹Annotations、Data、ImageSets

3.1 Annotations

3.2 Data

3.3 ImageSets

一、基本信息

数据集包括3862 snippets用于训练,555 snippets用于验证,937 snippets用于测试。每个snippet包括56~458帧图像不等。

该数据集有30个基本类别:

n02691156 1 airplane 飞机
n02419796 2 antelope 羚羊
n02131653 3 bear 熊
n02834778 4 bicycle 自行车
n01503061 5 bird 鸟
n02924116 6 bus 公交
n02958343 7 car 小汽车
n02402425 8 cattle 牛
n02084071 9 dog 狗
n02121808 10 domestic_cat 猫
n02503517 11 elephant 大象
n02118333 12 fox 狐狸
n02510455 13 giant_panda 熊猫
n02342885 14 hamster 仓鼠
n02374451 15 horse 马
n02129165 16 lion 狮子
n01674464 17 lizard 蜥蜴
n02484322 18 monkey 猴子
n03790512 19 motorcycle 摩托车
n02324045 20 rabbit 兔子
n02509815 21 red_panda 红熊猫
n02411705 22 sheep 羊
n01726692 23 snake 蛇
n02355227 24 squirrel 松鼠
n02129604 25 tiger 老虎
n04468005 26 train 火车
n01662784 27 turtle 海龟
n04530566 28 watercraft 船只
n02062744 29 whale 鲸鱼
n02391049 30 zebra 斑马

二、压缩包详细结构

1.压缩包

2.压缩包解压后

3.ILSVRC2015包含3个文件夹Annotations、Data、ImageSets

Annotations、Data、ImageSets内首先都是一个VID文件夹:

以下全是VID文件夹内的结构

3.1 Annotations

Annotations为注解,主要是每帧图bbox的标注,有train和val两个文件夹:

所有的train类文件夹都被分为了0000,0001,0002,0003四个类别。

ILSVRC2015\Annotations\VID\train包含以下文件(全部文件):

每个类别中会以每单个视频为细分依据,命名前五位代表同一细分类别,后三位为具体个例。

ILSVRC2015\Annotations\VID\train\ILSVRC2015_VID_train_0000文件夹内包含以下文件(部分文件):

每个文件夹中存放的是一个视频序列中每一帧的对应信息,以xml文件格式存储。

ILSVRC2015\Annotations\VID\train\ILSVRC2015_VID_train_0000\ILSVRC2015_train_00000000内包含以下文件(部分文件):

000000.xml文件内容:每张图长宽像素值固定(1280 x 720),bndbox为对应目标的标注(xmin, ymin)(xmax, ymax)分别为左上角与右下角坐标。object表示一个跟踪对象,trackid表示当前跟踪对象的id,一帧可有多个object。<occuluded></occuluded>表示物体是否被遮挡,如果为 0 表示图像中物体未被遮挡,为 1 表示当前物体被某些物体遮挡住。

<?xml version="1.0"?>
<annotation>
    <folder>ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000</folder>
    <filename>000000</filename>
    <source>
        <database>ILSVRC_2015</database>
    </source>
    <size>
        <width>1280</width>
        <height>720</height>
    </size>
    <object>
        <trackid>0</trackid>
        <name>n01674464</name>
        <bndbox>
            <xmax>1050</xmax>
            <xmin>323</xmin>
            <ymax>428</ymax>
            <ymin>216</ymin>
        </bndbox>
        <occluded>1</occluded>
        <generated>0</generated>
    </object>
</annotation>

ILSVRC2015\Annotations\VID\val包含以下文件(部分文件):

ILSVRC2015\Annotations\VID\val\ILSVRC2015_val_00000000包含以下文件(部分文件):

3.2 Data

Data文件夹中存放的是对应视频和每帧图片:视频存放于snippets文件夹,snippets文件夹也分为test,train,val三个文件夹,存放对应视频格式(.mp4)。每帧图片分为test,train,val三个文件夹存放。

3.2.1 snippets

ILSVRC2015\Data\VID\snippets\test包含以下文件(部分文件):

ILSVRC2015\Data\VID\snippets\train包含以下文件(部分文件):

ILSVRC2015\Data\VID\snippets\train\ILSVRC2015_VID_train_0000包含以下文件(部分文件):

ILSVRC2015\Data\VID\snippets\val包含以下文件(部分文件):

3.2.2 test

ILSVRC2015\Data\VID\test\ILSVRC2015_test_00000000包含以下文件(部分文件):

3.2.3 train

ILSVRC2015\Data\VID\train\ILSVRC2015_VID_train_0000包含以下文件(部分文件):

ILSVRC2015\Data\VID\train\ILSVRC2015_VID_train_0000\ILSVRC2015_train_00000000包含以下文件(部分文件):

3.2.4 val(部分文件)

ILSVRC2015\Data\VID\val\ILSVRC2015_val_00000000包含以下文件(部分文件):

3.3 ImageSets

ImageSets文件夹存放帧数文件的记录。

ILSVRC2015\ImageSets\VID\包含以下文件(全部文件):

  • 11
    点赞
  • 37
    收藏
    觉得还不错? 一键收藏
  • 23
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 23
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值