安全防护检测数据集 12类 3500张 PPE 动火带标注 voc yolo

qq767172261

于 2024-10-06 06:58:41 发布

阅读量425

点赞数 13

分类专栏：数据集文章标签：获取QQ767172261 数据集安全防护检测数据集

本文链接：https://blog.csdn.net/2301_78240361/article/details/142722142

版权

数据集专栏收录该内容

335 篇文章 14 订阅

订阅专栏

安全防护检测数据集 3500张 PPE 动火带标注 voc yolo

分类名: (图片张数，标注个数)
he Imet:
(3649，10494)
no_ goggles:
(2197，4545)
no_ mask: (2986， 6918)
no_ vest: (2602， 7462)
boots: (1802， 7657)
no_ gloves: (2278， 6350)
g loves:
: (1527， 3602)
no_ he Imet: (756， 2048)
vest: (1735， 4286)
goggles: (1108， 1965)
no_ boots:
(99，266)
mask: (167， 251)
总数: (4034， 55844)
总类(nc): 12类

安全防护检测数据集介绍

数据集名称

安全防护检测数据集 (Safety Protection Equipment Detection Dataset)

数据集概述

该数据集是一个专门用于训练和评估安全防护装备（PPE, Personal Protective Equipment）检测模型的数据集。数据集包含3500张图像，每张图像都带有标注信息，标注格式为VOC（Pascal VOC）和YOLO格式。这些图像涵盖了各种工作场景中工人穿戴的安全防护装备情况，适用于基于深度学习的目标检测任务。通过这个数据集，可以训练出能够准确检测和识别工人是否正确佩戴安全帽、护目镜、口罩、反光背心、手套和安全靴等防护装备的模型，从而帮助进行现场安全管理、合规性检查等应用。

数据集特点

高质量图像：数据集中的图像具有高分辨率，能够提供丰富的细节信息。
带标注：每张图像都有详细的标注信息，包括各种安全防护装备的位置和大小。
多格式标注：标注信息同时以VOC和YOLO格式提供，方便不同框架的使用。
实际应用场景：适用于需要精确检测工人安全防护装备佩戴情况的场景，如建筑工地、工厂、实验室等。

数据集结构

safety_ppe_detection_dataset/
├── images/                            # 图像文件
│   ├── 00001.jpg                      # 示例图像
│   ├── 00002.jpg
│   └── ...
├── annotations/                       # 标注文件
│   ├── VOC/                           # Pascal VOC格式标注
│   │   ├── 00001.xml                  # 示例VOC标注文件
│   │   ├── 00002.xml
│   │   └── ...
│   ├── YOLO/                          # YOLO格式标注
│   │   ├── 00001.txt                  # 示例YOLO标注文件
│   │   ├── 00002.txt
│   │   └── ...
├── data.yaml                          # 类别描述文件
├── README.md                          # 数据集说明

数据集内容

images/
- 功能：存放图像文件。
- 内容：
  - 00001.jpg：示例图像。
  - 00002.jpg：另一张图像。
  - ...
annotations/
- 功能：存放标注文件。
- 内容：
  - VOC/：存放Pascal VOC格式的标注文件。
    - 00001.xml：示例VOC标注文件。
    - 00002.xml：另一张图像的VOC标注文件。
    - ...
  - YOLO/：存放YOLO格式的标注文件。
    - 00001.txt：示例YOLO标注文件。
    - 00002.txt：另一张图像的YOLO标注文件。
    - ...

data.yaml

功能：定义数据集的类别和其他相关信息。

内容：

yaml

深色版本

train: safety_ppe_detection_dataset/images
val: safety_ppe_detection_dataset/images
nc: 12
names: ['he Imet', 'no_goggles', 'no_mask', 'no_vest', 'boots', 'no_gloves', 'gloves', 'no_he Imet', 'vest', 'goggles', 'no_boots', 'mask']

README.md
- 功能：数据集的详细说明文档。
- 内容：
  - 数据集的来源和用途。
  - 数据集的结构和内容。
  - 如何使用数据集进行模型训练和评估。
  - 其他注意事项和建议。

数据集统计

总图像数量：3500张
总标注框数量：55844个
类别：12类
平均每张图像的标注框数量：约16个

具体类别及其统计如下：

he Imet：(3649, 10494)
no_goggles：(2197, 4545)
no_mask：(2986, 6918)
no_vest：(2602, 7462)
boots：(1802, 7657)
no_gloves：(2278, 6350)
gloves：(1527, 3602)
no_he Imet：(756, 2048)
vest：(1735, 4286)
goggles：(1108, 1965)
no_boots：(99, 266)
mask：(167, 251)

使用说明

环境准备
- 安装依赖库：
```
pip install -r requirements.txt
```
- 确保安装了常用的深度学习库，例如torch, torchvision, numpy等。
数据集路径设置
- 将数据集解压到项目目录下，确保路径正确。

训练模型

以下是一个使用PyTorch和torchvision库进行安全防护装备检测的示例代码。我们将使用预训练的Faster R-CNN模型，并对其进行微调以适应我们的数据集。

python

深色版本

import torch
import torchvision
from torchvision.models.detection.faster_rcnn import FastRCNNPredictor
from torchvision.models.detection import FasterRCNN
from torchvision.models.detection.rpn import AnchorGenerator
from torchvision.transforms import functional as F
from torch.utils.data import DataLoader, Dataset
from PIL import Image
import os
import xml.etree.ElementTree as ET

# 自定义数据集类
class SafetyPPEDetectionDataset(Dataset):
    def __init__(self, root, transforms=None):
        self.root = root
        self.transforms = transforms
        self.imgs = list(sorted(os.listdir(os.path.join(root, "images"))))
        self.annotations = list(sorted(os.listdir(os.path.join(root, "annotations", "VOC"))))

    def __getitem__(self, idx):
        img_path = os.path.join(self.root, "images", self.imgs[idx])
        annotation_path = os.path.join(self.root, "annotations", "VOC", self.annotations[idx])

        img = Image.open(img_path).convert("RGB")
        annotation_root = ET.parse(annotation_path).getroot()

        boxes = []
        labels = []
        for obj in annotation_root.findall('object'):
            xmin, ymin, xmax, ymax = [int(obj.find('bndbox').find(tag).text) for tag in ('xmin', 'ymin', 'xmax', 'ymax')]
            label = obj.find('name').text
            label_id = ['he Imet', 'no_goggles', 'no_mask', 'no_vest', 'boots', 'no_gloves', 'gloves', 'no_he Imet', 'vest', 'goggles', 'no_boots', 'mask'].index(label) + 1
            boxes.append([xmin, ymin, xmax, ymax])
            labels.append(label_id)

        boxes = torch.as_tensor(boxes, dtype=torch.float32)
        labels = torch.as_tensor(labels, dtype=torch.int64)

        target = {}
        target["boxes"] = boxes
        target["labels"] = labels
        target["image_id"] = torch.tensor([idx])

        if self.transforms is not None:
            img, target = self.transforms(img, target)

        return F.to_tensor(img), target

    def __len__(self):
        return len(self.imgs)

# 数据预处理
def get_transform(train):
    transforms = []
    if train:
        transforms.append(torchvision.transforms.RandomHorizontalFlip(0.5))
    return torchvision.transforms.Compose(transforms)

# 加载数据集
dataset = SafetyPPEDetectionDataset(root='safety_ppe_detection_dataset', transforms=get_transform(train=True))
dataset_test = SafetyPPEDetectionDataset(root='safety_ppe_detection_dataset', transforms=get_transform(train=False))

indices = torch.randperm(len(dataset)).tolist()
dataset = torch.utils.data.Subset(dataset, indices[:-500])
dataset_test = torch.utils.data.Subset(dataset_test, indices[-500:])

data_loader = DataLoader(dataset, batch_size=2, shuffle=True, num_workers=4, collate_fn=lambda x: tuple(zip(*x)))
data_loader_test = DataLoader(dataset_test, batch_size=1, shuffle=False, num_workers=4, collate_fn=lambda x: tuple(zip(*x)))

# 定义模型
model = torchvision.models.detection.fasterrcnn_resnet50_fpn(pretrained=True)
num_classes = 13  # 12类防护装备 + 背景
in_features = model.roi_heads.box_predictor.cls_score.in_features
model.roi_heads.box_predictor = FastRCNNPredictor(in_features, num_classes)

# 设置设备
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

# 定义优化器
params = [p for p in model.parameters() if p.requires_grad]
optimizer = torch.optim.SGD(params, lr=0.005, momentum=0.9, weight_decay=0.0005)

# 训练模型
num_epochs = 10
for epoch in range(num_epochs):
    model.train()
    for images, targets in data_loader:
        images = list(image.to(device) for image in images)
        targets = [{k: v.to(device) for k, v in t.items()} for t in targets]

        loss_dict = model(images, targets)
        losses = sum(loss for loss in loss_dict.values())

        optimizer.zero_grad()
        losses.backward()
        optimizer.step()

    print(f'Epoch {epoch+1}/{num_epochs}, Loss: {losses.item()}')

    # 验证模型
    model.eval()
    with torch.no_grad():
        for images, targets in data_loader_test:
            images = list(image.to(device) for image in images)
            targets = [{k: v.to(device) for k, v in t.items()} for t in targets]
            outputs = model(images)

# 保存模型
torch.save(model.state_dict(), 'safety_ppe_detection_model.pth')