数据集概述
v
本数据集专为工地场景下的工程机械和卡车检测任务而设计,包含了大量的工地现场图像,每张图像均包含了详细的工程机械和卡车的标注信息。数据集旨在帮助研究人员和开发人员训练高精度的目标检测模型,以应用于工地安全监控、施工进度管理和设备管理等多个领域。
数据集特点
- 图像数量:共计6502张高质量图像,涵盖了各种工地场景下的工程机械和卡车。
- 标注信息:每张图像都经过专业标注,确保每个目标对象的位置和类别信息被准确记录。
- 多样性和复杂性:数据集覆盖了多种类型的工程机械(如挖掘机、推土机等)和卡车,以及它们在不同光线条件、天气状况和施工环境下的不同状态。
- 兼容性:数据集支持VOC、YOLO v5、YOLO v7和YOLO v8等多种格式,方便用户根据自身需求选择合适的数据集格式进行模型训练。
数据集格式
-
VOC格式
- 包含XML文件,其中记录了每个图像的基本信息(如尺寸)以及每个目标对象的位置(矩形框坐标)和类别标签。
- 图像文件和对应的XML文件通常存储在不同的文件夹中。
-
YOLO格式
- 每个图像对应一个文本文件(
.txt
),文本文件中每一行代表一个对象的标注信息。 - 标注信息包括类别编号、对象中心相对于图像的比例坐标以及对象宽度和高度相对于图像的比例值。
- YOLO v5/v7/v8版本之间的差异主要体现在模型架构和一些训练策略上,对于数据集格式的要求基本一致。
- 每个图像对应一个文本文件(
数据集目录结构
以下是数据集可能的目录结构示例:
1construction_machinery_truck_dataset/
2├── images/
3│ ├── train/
4│ │ ├── img1.jpg
5│ │ ├── img2.jpg
6│ │ └── ...
7│ ├── val/
8│ │ ├── img4001.jpg
9│ │ ├── img4002.jpg
10│ │ └── ...
11│ └── test/
12│ ├── img6001.jpg
13│ ├── img6002.jpg
14│ └── ...
15├── labels/
16│ ├── train/
17│ │ ├── img1.txt
18│ │ ├── img2.txt
19│ │ └── ...
20│ ├── val/
21│ │ ├── img4001.txt
22│ │ ├── img4002.txt
23│ │ └── ...
24│ └── test/
25│ ├── img6001.txt
26│ │ ├── img6002.txt
27│ │ └── ...
28└── annotations/
29 ├── train/
30 │ ├── img1.xml
31 │ ├── img2.xml
32 │ └── ...
33 ├── val/
34 │ ├── img4001.xml
35 │ ├── img4002.xml
36 │ └── ...
37 └── test/
38 ├── img6001.xml
39 ├── img6002.xml
40 └── ...
数据集内容
- 类别:包含多种工程机械(如挖掘机、推土机、装载机等)和卡车。
- 场景:涵盖了各种工地环境,包括但不限于城市建筑工地、道路施工、矿山开采等。
- 光照条件:包括白天、傍晚、夜晚等多种光照条件。
- 天气状况:晴天、阴天、雨天等不同天气条件下拍摄的图像。
- 标注信息:每个目标对象的位置信息(矩形框坐标)和类别标签。
使用指南
- 数据准备:确保所有图像和对应的标注文件都已正确放置在相应的文件夹中。
- 数据预处理:根据使用的模型框架要求,可能需要转换数据集格式或者调整图像大小。
- 模型训练:使用此数据集来训练目标检测模型,例如YOLO系列模型。
- 评估与测试:利用测试集评估模型性能,并进行必要的调整以优化模型。
标注信息示例
-
VOC格式:
1<annotation> 2 <folder>construction_machinery_truck_dataset</folder> 3 <filename>img1.jpg</filename> 4 <object> 5 <name>Excavator</name> 6 <pose>Unspecified</pose> 7 <truncated>0</truncated> 8 <difficult>0</difficult> 9 <bndbox> 10 <xmin>100</xmin> 11 <ymin>200</ymin> 12 <xmax>300</xmax> 13 <ymax>400</ymax> 14 </bndbox> 15 </object> 16</annotation>
-
YOLO格式:
10 0.45 0.55 0.2 0.3 # 类别索引0表示Excavator,后续数字表示中心点坐标和宽高相对于图像尺寸的比例