如何训练自己的轴承数据集之—轴承缺陷数据集滚动轴承数据集大类

计算机C9硕士_算法工程师

已于 2024-10-31 06:22:18 修改

阅读量1.5k

点赞数 22

分类专栏：数据集轴承大类文章标签： xml YOLO 目标检测机器学习计算机视觉目标跟踪

于 2024-10-26 07:17:13 首次发布

本文链接：https://blog.csdn.net/2401_88440984/article/details/143247668

版权

数据集同时被 2 个专栏收录

280 篇文章

订阅专栏

轴承大类

15 篇文章

订阅专栏

1.轴承数据集轴承缺陷数据集 3类5824张xml2.滚动轴承数据集故障诊断，预测、分类最全套数据集 j集合西储大学XJTU西安交通大学江南大学渥太华变速轴承数据集可做对比实验一，轴承表面缺陷检测数据集

1.该数据集的缺陷类别共为三类，分别包含：擦伤缺陷（cashang），凹槽缺陷（aocao），划痕缺陷（huahen）。

2.该数据集共5824张JPG图片，5824个xml标签文件。三类缺陷在标签文件中分别命名为：cashang，aocao，huahen。
3.可以提供无压缩的高清轴承图片。
4.还可以提供高分辨率轴承缺陷数据集，为拍摄时只进行内存压缩后的数据。

此数据集主要用于轴承表面缺陷检测任务，涵盖了三类不同的缺陷：擦伤缺陷（cashang）、凹槽缺陷（aocao）和划痕缺陷（huahen）。该数据集包含5824张高清JPG图像，每张图像对应一个VOC XML格式的标签文件。数据集为一手资源，提供了无压缩的高清图像，并且还提供了高分辨率版本的数据集（内存压缩后）。

数据集特点

高清影像：所有图像均为高清影像，适合用于精确的缺陷检测。
详细标注：每张图像都标注了三种不同缺陷的位置，可以用于训练模型来识别这些缺陷。
多样性：涵盖了不同情境下的缺陷场景，适用于多种环境下的应用。
直接可用性：数据集已按照标准VOC XML格式标注，无需进一步处理即可直接用于模型训练。
多类别：数据集中标注了三种类别，适合进行多目标检测任务。

数据集统计

缺陷类型	类别ID	图像数量	标注个数
擦伤缺陷	0	未知	未知
凹槽缺陷	1	未知	未知
划痕缺陷	2	未知	未知
总计		5824	未知

数据集结构

BearingSurfaceDefectDetectionDataset/
├── images/  # 图像文件
│   ├── train/  # 训练集图像
│   │   ├── image_00001.jpg
│   │   ├── image_00002.jpg
│   │   └── ...
│   ├── val/  # 验证集图像
│   │   ├── image_00001.jpg
│   │   ├── image_00002.jpg
│   │   └── ...
│   └── test/  # 测试集图像（如果存在）
│       ├── image_00001.jpg
│       ├── image_00002.jpg
│       └── ...
└── annotations_voc/  # VOC/Pascal VOC格式标注
    ├── train/  # 训练集标注
    │   ├── image_00001.xml
    │   ├── image_00002.xml
    │   └── ...
    ├── val/  # 验证集标注
    │   ├── image_00001.xml
    │   ├── image_00002.xml
    │   └── ...
    └── test/  # 测试集标注（如果存在）
        ├── image_00001.xml
        ├── image_00002.xml
        └── ...

标注格式示例

VOC/Pascal VOC格式

每个XML文件包含图像信息和标注信息：

<annotation>
    <folder>images</folder>
    <filename>image_00001.jpg</filename>
    <path>/path/to/images/image_00001.jpg</path>
    <source>
        <database>Unknown</database>
    </source>
    <size>
        <width>640</width>
        <height>480</height>
        <depth>3</depth>
    </size>
    <segmented>0</segmented>
    <object>
        <name>cashang</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>100</xmin>
            <ymin>150</ymin>
            <xmax>200</xmax>
            <ymax>300</ymax>
        </bndbox>
    </object>
    <object>
        <name>aocao</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>300</xmin>
            <ymin>250</ymin>
            <xmax>400</xmax>
            <ymax>350</ymax>
        </bndbox>
    </object>
    <object>
        <name>huahen</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>400</xmin>
            <ymin>350</ymin>
            <xmax>500</xmax>
            <ymax>450</ymax>
        </bndbox>
    </object>
</annotation>

使用该数据集进行模型训练

1. 数据预处理与加载

首先，我们需要加载数据并将其转换为适合YOLOv5等模型使用的格式。假设你已经安装了PyTorch和YOLOv5。

import os
from PIL import Image
import torch
from torch.utils.data import Dataset, DataLoader
from torchvision import transforms
import xml.etree.ElementTree as ET

class BearingSurfaceDefectDetectionDataset(Dataset):
    def __init__(self, image_dir, annotation_dir, transform=None):
        self.image_dir = image_dir
        self.annotation_dir = annotation_dir
        self.transform = transform
        self.image_files = [f for f in os.listdir(image_dir) if f.endswith('.jpg')]

    def __len__(self):
        return len(self.image_files)

    def __getitem__(self, idx):
        img_name = self.image_files[idx]
        img_path = os.path.join(self.image_dir, img_name)
        annotation_path = os.path.join(self.annotation_dir, img_name.replace('.jpg', '.xml'))

        # 加载图像
        image = Image.open(img_path).convert('RGB')
        if self.transform:
            image = self.transform(image)

        # 加载标注
        tree = ET.parse(annotation_path)
        root = tree.getroot()

        boxes = []
        labels = []
        for obj in root.findall('object'):
            category = obj.find('name').text.lower()
            if category == 'cashang':
                class_id = 0
            elif category == 'aocao':
                class_id = 1
            elif category == 'huahen':
                class_id = 2
            else:
                continue
            
            bbox = obj.find('bndbox')
            xmin = int(bbox.find('xmin').text)
            ymin = int(bbox.find('ymin').text)
            xmax = int(bbox.find('xmax').text)
            ymax = int(bbox.find('ymax').text)
            
            boxes.append([xmin, ymin, xmax, ymax])
            labels.append(class_id)

        boxes = torch.tensor(boxes, dtype=torch.float32)
        labels = torch.tensor(labels, dtype=torch.int64)

        return image, boxes, labels

# 数据增强
transform = transforms.Compose([
    transforms.Resize((640, 640)),
    transforms.ToTensor(),
])

# 创建数据集
train_dataset = BearingSurfaceDefectDetectionDataset(image_dir='BearingSurfaceDefectDetectionDataset/images/train/', annotation_dir='BearingSurfaceDefectDetectionDataset/annotations_voc/train/', transform=transform)
val_dataset = BearingSurfaceDefectDetectionDataset(image_dir='BearingSurfaceDefectDetectionDataset/images/val/', annotation_dir='BearingSurfaceDefectDetectionDataset/annotations_voc/val/', transform=transform)

train_loader = DataLoader(train_dataset, batch_size=4, shuffle=True, num_workers=4)
val_loader = DataLoader(val_dataset, batch_size=4, shuffle=False, num_workers=4)

2. 构建模型

我们可以使用YOLOv5模型进行目标检测任务。假设你已经克隆了YOLOv5仓库，并按照其文档进行了环境设置。

git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt

创建数据配置文件 data/bearing_surface_defect_detection.yaml：

train: path/to/BearingSurfaceDefectDetectionDataset/images/train
val: path/to/BearingSurfaceDefectDetectionDataset/images/val
test: path/to/BearingSurfaceDefectDetectionDataset/images/val  # 如果没有单独的测试集，可使用验证集作为测试集

nc: 3  # 类别数
names: ['cashang', 'aocao', 'huahen']

3. 训练模型

使用YOLOv5进行训练。

python train.py --img 640 --batch 16 --epochs 100 --data data/bearing_surface_defect_detection.yaml --weights yolov5s.pt --cache

4. 评估模型

在验证集上评估模型性能。

python val.py --img 640 --batch 16 --data data/bearing_surface_defect_detection.yaml --weights runs/train/exp/weights/best.pt --task test

5. 推理

使用训练好的模型进行推理。

python detect.py --source path/to/test/image.jpg --weights runs/train/exp/weights/best.pt --conf 0.5

实验报告

实验报告应包括以下内容：

项目简介：简要描述项目的背景、目标和意义。
数据集介绍：详细介绍数据集的来源、规模、标注格式等。
模型选择与配置：说明选择的模型及其配置参数。
训练过程：记录训练过程中的损失变化、学习率调整等。
评估结果：展示模型在验证集上的性能指标（如mAP、准确率）。
可视化结果：提供一些典型样本的检测结果可视化图。
结论与讨论：总结实验结果，讨论可能的改进方向。
附录：包含代码片段、图表等补充材料。

依赖库

确保安装了以下依赖库：

pip install torch torchvision
pip install -r yolov5/requirements.txt

总结

这个轴承表面缺陷检测数据集提供了丰富的标注数据，非常适合用于训练和评估缺陷检测模型。通过YOLOv5框架，可以方便地构建和训练高性能的缺陷检测模型。实验报告可以帮助你更好地理解和分析模型的表现，并为进一步的研究提供参考。由于数据集规模较大且多样，建议在训练过程中使用数据增强技术以提高模型的泛化能力。

二，滚动轴承数据集故障诊断，预测、分类最全套数据集

滚动轴承故障诊断、预测与分类数据集介绍

数据集概述

本数据集集合了五个知名的滚动轴承故障诊断、预测与分类数据集，分别是CWRU西储大学轴承数据集、MFPT机械故障协会数据集、XJTU西安交通大学数据集、渥太华变速轴承数据集以及江南大学轴承数据集。这些数据集广泛应用于滚动轴承的健康状态监测、故障诊断及寿命预测等领域，是研究滚动轴承健康管理和故障检测的重要资源。

数据集特点

多样性：涵盖多个知名研究机构的数据集，提供了多种工况下滚动轴承的振动信号和其他相关信息。
实用性：可用于滚动轴承故障诊断、健康状态监测及寿命预测等多个领域的研究。
全面性：提供了大量不同类型的滚动轴承数据，支持各种类型的故障诊断与分类实验。
易用性：数据集整理清晰，便于研究人员快速上手进行实验。

数据集列表

1. CWRU西储大学轴承数据集

来源：Case Western Reserve University (CWRU)。
描述：该数据集包含了不同负载条件下的滚动轴承振动信号，涵盖了健康的轴承以及带有不同大小的人工缺陷的轴承。数据集包括了不同速度下的振动数据，可以用于滚动轴承的故障诊断。
应用场景：滚动轴承的健康状态监测、故障诊断及寿命预测。