红外道路车辆行人检测数据集 15000张带标注 voc yolo 9类

qq767172261

于 2024-10-04 05:02:02 发布

阅读量583

点赞数 12

分类专栏：数据集文章标签：获取QQ767172261 数据集红外道路车辆行人检测数据集

本文链接：https://blog.csdn.net/2301_78240361/article/details/142698760

版权

数据集专栏收录该内容

310 篇文章 14 订阅

订阅专栏

红外道路车辆行人检测数据集 15000张带标注 voc yolo

红外道路车辆行人检测数据集介绍

数据集名称

红外道路车辆行人检测数据集 (Infrared Road Vehicle and Pedestrian Detection Dataset)

数据集概述

该数据集专为训练和评估基于YOLO系列目标检测模型（包括YOLOv5、YOLOv6、YOLOv7等）而设计，旨在帮助研究人员和开发者创建能够高效识别红外图像中的道路车辆和行人的系统。通过使用这个数据集，可以开发出适用于夜间或低光照条件下的智能交通监控、自动驾驶等多种应用场景的技术解决方案。

数据集规格

总图像数量：15,000张
- 训练集：具体划分比例未提供，通常建议按照70%（训练）、20%（验证）、10%（测试）的比例来分配。
标注格式：
- VOC格式：每个图像对应一个XML文件，包含边界框坐标及类别信息。
- YOLO格式：每个图像对应一个TXT文件，包含边界框坐标及类别ID。
分辨率：图像分辨率可能有所不同，但为了保证一致性，推荐将所有图像调整至统一尺寸，如640x640或1280x1280像素。
类别：涵盖多种常见的道路目标类型，包括流浪动物、行人、骑车人、公交车、汽车、重型车辆、自行车、电动三轮车和摩托车。

数据集结构

infrared_road_dataset/
├── images/
│   ├── train/
│   ├── val/
│   └── test/
├── labels/
│   ├── train/
│   ├── val/
│   └── test/
└── data.yaml

images/ 目录下存放的是原始图像文件。
labels/ 目录存放与图像对应的标注文件，每个图像文件都有一个同名的.txt文件存储其YOLO格式的标注信息，以及一个同名的.xml文件存储其VOC格式的标注信息。
data.yaml 文件包含了关于数据集的基本信息，如路径指向、类别数目及其名称等关键参数。

数据集配置文件 (`data.yaml`)

# 训练集图像路径
train: path_to_your_train_images
# 验证集图像路径
val: path_to_your_val_images
# 测试集图像路径（如果有的话）
test: path_to_your_test_images

# 类别数量
nc: 9
# 类别名称
names: ['Stray Animal', 'Person', 'Rider', 'Bus', 'Car', 'Heavy Vehicle', 'Bicycle', 'Electric Rikshaw', 'Motorcycle']

标注统计

流浪动物 (Stray Animal)：840张图像，共2,050个实例
行人 (Person)：9,422张图像，共29,736个实例
骑车人 (Rider)：6,582张图像，共11,630个实例
公交车 (Bus)：1,536张图像，共1,922个实例
汽车 (Car)：2,945张图像，共3,904个实例
重型车辆 (Heavy Vehicle)：1,650张图像，共1,847个实例
自行车 (Bicycle)：313张图像，共505个实例
电动三轮车 (Electric Rikshaw)：2,408张图像，共3,539个实例
摩托车 (Motorcycle)：362张图像，共415个实例
总计 (total)：15,049张图像，共55,548个实例

标注示例

YOLO格式

对于一张图片中包含一个“行人”情况，相应的.txt文件内容可能是：

1 0.5678 0.3456 0.1234 0.2345

这里1代表“行人”这一类别的ID，后续四个数字依次表示物体在图像中的相对位置（中心点x, 中心点y, 宽度w, 高度h），所有值均归一化到[0, 1]范围内。

VOC格式

对于同一张图片，相应的.xml文件内容可能是：

<annotation>
    <folder>images</folder>
    <filename>000001.jpg</filename>
    <size>
        <width>640</width>
        <height>640</height>
        <depth>3</depth>
    </size>
    <object>
        <name>Person</name>
        <bndbox>
            <xmin>180</xmin>
            <ymin>200</ymin>
            <xmax>300</xmax>
            <ymax>400</ymax>
        </bndbox>
    </object>
</annotation>

这里<name>标签指定了类别名称（Person），<bndbox>标签定义了边界框的坐标。

使用说明

准备环境：
- ```
pip install -r requirements.txt
```
数据预处理：
- 将图像和标注文件分别放在images/和labels/目录下。
- 修改data.yaml文件中的路径以匹配你的数据集位置。
- 如果需要，可以使用脚本将VOC格式的标注文件转换为YOLO格式，或者反之。
修改配置文件：
- 更新data.yaml以反映正确的数据路径。
- 如果使用YOLOv5或其他特定版本的YOLO，还需要更新相应的模型配置文件（如models/yolov5s.yaml）。
开始训练：
- 使用提供的训练脚本启动模型训练过程。例如，对于YOLOv5，可以使用以下命令进行训练：
```
python train.py --img 640 --batch 16 --epochs 100 --data data.yaml --weights yolov5s.pt
```
性能评估：
- 训练完成后，使用验证集或测试集对模型进行评估，检查mAP等指标是否达到预期水平。例如，对于YOLOv5，可以使用以下命令进行评估：
```
python val.py --data data.yaml --weights runs/train/exp/weights/best.pt --img 640
```
部署应用：
- 将训练好的模型应用于实际场景中，实现红外图像中的道路目标自动检测功能。例如，可以使用以下命令进行推理：
```
python detect.py --source path_to_your_test_images --weights runs/train/exp/weights/best.pt --conf 0.4
```