该数据集提供了带注释的热成像数据集和对应的无注释RGB图像,用于训练和验证神经网络。
数据集总共包含14452张红外图像,其中10228张来自多个短视频;4224张来自一个长为144s的视频。所有视频都来自街道和高速路。大多数图片的采样率为1秒两帧,其中视频的帧率为1秒30帧;少数环境中目标较少时,采样率为1秒1帧。
train文件夹
文件名 | 注释 |
---|---|
Annotated_thermal_8_bit | 带标注框的红外图像 |
RGB | 不带标注框RGB图像 |
thermal_8_bit | 不带标注框红外图像 |
thermal_16_bit | tiff文件 |
thermal_annotations.json | 标注的json文件 |
JSON文件详解
第一部分
"info": {
"version": 1.0,
"url": "no url specified",
"year": 2019,
"date_created": "today",
"contributor": "no contributor specified",
"description": ""
},
含义:文件开头 有关的版本信息、时间啥的
第二部分
"categories": [
{
"name": "person",
"id": 1,
"supercategory": "unknown"
},
{
"name": "bicycle",
"id": 2,
"supercategory": "unknown"
},
···
{
"name": "empty",
"id": 0,
"supercategory": "unknown"
}
}
含义:定义标签及标签ID,这里用的是coco一样的不过这个数据集只对五类进行了标注:
- 类别 1:People
- 类别 2:Bicycle —— 自行车和摩托车(与coco不一致)
- 类别 3:Cars ——私人汽车或者其他小型商用汽车。
- 类别 18:Dogs
- 类别 91:其他汽车 —— 大型卡车,船,拖车
第三部分:数据部分–也是用到的部分
"licenses": [],
"annotations": [
{
"image_id": 0,-----------------------------图片id
"extra_info": {-----------------------------额外信息
"human_annotated": true-----------人工标注:true
},
"category_id": 3,---------------------类别id,就是所标注的类对应的id
"iscrowd": 0,-------------0表示标注一个对象,segmentation格式使用polygons,1表示标注多个对象,segmentation格式使用RLE格式
"id": 1,----------------------------------第几个框
"segmentation": [--框的四个点坐标
[
202,
190,
202,
312,
334,
312,
334,
190
]
],
"bbox": [-----框的x,y,h,w 左上角第一个坐标和框的长,宽
202,
190,
132,
122
],
"area": 16104-----------标注面积
},