红外道路车辆行人检测数据集 15000张 带标注 voc yolo 9类

红外道路车辆行人检测数据集 15000张 带标注 voc yolo

红外道路车辆行人检测数据集介绍

数据集名称

红外道路车辆行人检测数据集 (Infrared Road Vehicle and Pedestrian Detection Dataset)

数据集概述

该数据集专为训练和评估基于YOLO系列目标检测模型(包括YOLOv5、YOLOv6、YOLOv7等)而设计,旨在帮助研究人员和开发者创建能够高效识别红外图像中的道路车辆和行人的系统。通过使用这个数据集,可以开发出适用于夜间或低光照条件下的智能交通监控、自动驾驶等多种应用场景的技术解决方案。

数据集规格
  • 总图像数量:15,000张
    • 训练集:具体划分比例未提供,通常建议按照70%(训练)、20%(验证)、10%(测试)的比例来分配。
  • 标注格式
    • VOC格式:每个图像对应一个XML文件,包含边界框坐标及类别信息。
    • YOLO格式:每个图像对应一个TXT文件,包含边界框坐标及类别ID。
  • 分辨率:图像分辨率可能有所不同,但为了保证一致性,推荐将所有图像调整至统一尺寸,如640x640或1280x1280像素。
  • 类别:涵盖多种常见的道路目标类型,包括流浪动物、行人、骑车人、公交车、汽车、重型车辆、自行车、电动三轮车和摩托车。
数据集结构

infrared_road_dataset/
├── images/
│   ├── train/
│   ├── val/
│   └── test/
├── labels/
│   ├── train/
│   ├── val/
│   └── test/
└── data.yaml
  • images/ 目录下存放的是原始图像文件。
  • labels/ 目录存放与图像对应的标注文件,每个图像文件都有一个同名的.txt文件存储其YOLO格式的标注信息,以及一个同名的.xml文件存储其VOC格式的标注信息。
  • data.yaml 文件包含了关于数据集的基本信息,如路径指向、类别数目及其名称等关键参数。
数据集配置文件 (data.yaml)

# 训练集图像路径
train: path_to_your_train_images
# 验证集图像路径
val: path_to_your_val_images
# 测试集图像路径(如果有的话)
test: path_to_your_test_images

# 类别数量
nc: 9
# 类别名称
names: ['Stray Animal', 'Person', 'Rider', 'Bus', 'Car', 'Heavy Vehicle', 'Bicycle', 'Electric Rikshaw', 'Motorcycle']
标注统计
  • 流浪动物 (Stray Animal):840张图像,共2,050个实例
  • 行人 (Person):9,422张图像,共29,736个实例
  • 骑车人 (Rider):6,582张图像,共11,630个实例
  • 公交车 (Bus):1,536张图像,共1,922个实例
  • 汽车 (Car):2,945张图像,共3,904个实例
  • 重型车辆 (Heavy Vehicle):1,650张图像,共1,847个实例
  • 自行车 (Bicycle):313张图像,共505个实例
  • 电动三轮车 (Electric Rikshaw):2,408张图像,共3,539个实例
  • 摩托车 (Motorcycle):362张图像,共415个实例
  • 总计 (total):15,049张图像,共55,548个实例
标注示例
YOLO格式

对于一张图片中包含一个“行人”情况,相应的.txt文件内容可能是:

1 0.5678 0.3456 0.1234 0.2345

这里1代表“行人”这一类别的ID,后续四个数字依次表示物体在图像中的相对位置(中心点x, 中心点y, 宽度w, 高度h),所有值均归一化到[0, 1]范围内。

VOC格式

对于同一张图片,相应的.xml文件内容可能是:

<annotation>
    <folder>images</folder>
    <filename>000001.jpg</filename>
    <size>
        <width>640</width>
        <height>640</height>
        <depth>3</depth>
    </size>
    <object>
        <name>Person</name>
        <bndbox>
            <xmin>180</xmin>
            <ymin>200</ymin>
            <xmax>300</xmax>
            <ymax>400</ymax>
        </bndbox>
    </object>
</annotation>

这里<name>标签指定了类别名称(Person),<bndbox>标签定义了边界框的坐标。

使用说明
  1. 准备环境

    • pip install -r requirements.txt
  2. 数据预处理

    • 将图像和标注文件分别放在images/labels/目录下。
    • 修改data.yaml文件中的路径以匹配你的数据集位置。
    • 如果需要,可以使用脚本将VOC格式的标注文件转换为YOLO格式,或者反之。
  3. 修改配置文件

    • 更新data.yaml以反映正确的数据路径。
    • 如果使用YOLOv5或其他特定版本的YOLO,还需要更新相应的模型配置文件(如models/yolov5s.yaml)。
  4. 开始训练

    • 使用提供的训练脚本启动模型训练过程。例如,对于YOLOv5,可以使用以下命令进行训练:
      python train.py --img 640 --batch 16 --epochs 100 --data data.yaml --weights yolov5s.pt
  5. 性能评估

    • 训练完成后,使用验证集或测试集对模型进行评估,检查mAP等指标是否达到预期水平。例如,对于YOLOv5,可以使用以下命令进行评估:
       
      python val.py --data data.yaml --weights runs/train/exp/weights/best.pt --img 640
  6. 部署应用

    • 将训练好的模型应用于实际场景中,实现红外图像中的道路目标自动检测功能。例如,可以使用以下命令进行推理:
       
      python detect.py --source path_to_your_test_images --weights runs/train/exp/weights/best.pt --conf 0.4
注意事项
  • 数据增强:可以通过调整数据增强策略来进一步提高模型性能,例如随机裁剪、旋转、亮度对比度调整等。
  • 超参数调整:根据实际情况调整学习率、批大小等超参数,以获得最佳训练效果。
  • 硬件要求:建议使用GPU进行训练,以加快训练速度。如果没有足够的计算资源,可以考虑使用云服务提供商的GPU实例。
  • 平衡数据:注意数据集中各类别之间的不平衡问题,可以通过过采样、欠采样或使用类别权重等方式来解决。
  • 红外图像特性:红外图像与可见光图像在特征上有显著差异,因此在训练时需要注意模型对红外图像特性的适应性。

通过上述步骤,你可以成功地使用YOLO系列模型进行红外图像中的道路车辆和行人检测,并获得高精度的检测结果。该数据集为研究者们提供了一个良好的起点,用于探索如何有效地利用计算机视觉技术解决各种实际问题,特别是在夜间或低光照条件下的智能交通监控和自动驾驶领域。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值