python深度学习项目~垃圾分类：使用YOLOv10进行垃圾检测与分类~YOLOv5、YOLOv6、YOLOv7、YOLOv8、YOLOv10、pyqt6 ui界面

深度学习实战项目

于 2024-10-05 13:04:16 发布

阅读量219

点赞数 7

分类专栏： YOLOv10/v8/v7/v6/v5实战项目文章标签： python 深度学习分类 YOLO 人工智能开发语言 ui

本文链接：https://blog.csdn.net/m0_52343631/article/details/142713457

版权

YOLOv10/v8/v7/v6/v5实战项目专栏收录该内容

90 篇文章 0 订阅

订阅专栏

引言

垃圾分类是现代城市管理中不可或缺的一部分，它不仅能够减少垃圾处理的成本，还能促进资源的回收利用。随着深度学习技术的发展，计算机视觉在垃圾分类中发挥着越来越重要的作用。本文将详细介绍如何使用YOLOv10进行垃圾检测与分类，并提供相应的代码实现和数据集配置文件。

1. YOLOv10简介

YOLO（You Only Look Once）是一种实时目标检测算法。YOLOv10是该系列的最新版本，具有更高的检测精度和更快的推理速度。其核心思想是将目标检测视为一个回归问题，通过单一的神经网络直接预测边界框和类标签。

1.1 YOLOv10的优势

实时性：YOLOv10能够在较低的延迟下处理视频流，使其适用于实时监控。
高精度：与传统的目标检测方法相比，YOLOv10在准确性上有显著提升。
多种应用：不仅适用于垃圾分类，还可以扩展到其他领域，如行人检测、车辆识别等。

2. 项目需求

在本项目中，我们将实现一个垃圾分类系统，能够识别并分类不同类型的垃圾，包括但不限于：

可回收垃圾
湿垃圾
干垃圾
有害垃圾

2.1 硬件要求

计算机：推荐使用带有独立显卡的计算机，以加快训练和推理速度。
摄像头：可以使用USB摄像头或手机摄像头进行实时检测。

2.2 软件要求

操作系统：推荐使用Ubuntu 20.04或Windows 10/11。
Python：版本3.7及以上。
PyTorch：版本1.7及以上。
其他依赖：OpenCV、NumPy、Matplotlib等。

3. 数据集准备

3.1 数据集收集

为了训练YOLOv10，我们需要一个包含不同类型垃圾的图像数据集。可以从以下渠道获取数据：

公共数据集：如TrashNet、TACO等。
自定义数据集：使用手机或相机拍摄日常垃圾，确保不同类型垃圾的样本均匀分布。

3.2 数据集标注

使用LabelImg等工具对收集到的图像进行标注。标注格式为YOLO格式，即每个图像对应一个txt文件，文件中每一行包含：

<类索引> <中心x> <中心y> <宽度> <高度>

其中，坐标和尺寸是归一化到[0, 1]的。

3.3 数据集结构

假设我们的数据集名为garbage_dataset，其结构如下：

garbage_dataset/
│
├── images/
│   ├── train/
│   ├── val/
│   └── test/
│
└── labels/
    ├── train/
    ├── val/
    └── test/

3.4 data.yaml文件

在YOLOv10中，数据集的配置文件data.yaml描述了数据集的结构和类别信息。以下是一个示例data.yaml文件：

train: ./garbage_dataset/images/train
val: ./garbage_dataset/images/val

nc: 4  # 类别数量
names: ['可回收垃圾', '湿垃圾', '干垃圾', '有害垃圾']  # 类别名称

4. 环境配置

4.1 安装依赖

确保安装了所需的库。在终端中运行以下命令：

# 创建一个虚拟环境（可选）
python -m venv yolov10_env
source yolov10_env/bin/activate  # Linux/Mac
yolov10_env\Scripts\activate  # Windows

# 安装依赖
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
pip install opencv-python matplotlib numpy

4.2 下载YOLOv10代码

在GitHub上下载YOLOv10的源代码：

git clone https://github.com/ultralytics/yolov10.git
cd yolov10

5. 模型训练

5.1 训练YOLOv10

使用以下命令开始训练YOLOv10模型：

python train.py --img 640 --batch 16 --epochs 100 --data data.yaml --weights yolov10.pt

--img: 输入图像的尺寸。
--batch: 每个训练步骤的批次大小。
--epochs: 训练的轮数。
--data: 数据集配置文件的路径。
--weights: 预训练权重的路径（使用YOLOv10的预训练权重）。

5.2 训练结果分析

训练完成后，模型的结果会保存在runs/train/exp目录下，包括：

权重文件
日志文件
训练过程中的损失曲线

可以使用TensorBoard等工具可视化训练过程：

tensorboard --logdir=runs/train

6. 模型测试与评估

在训练完成后，我们可以使用测试集评估模型的性能。使用以下命令测试模型：

python val.py --weights runs/train/exp/weights/best.pt --data data.yaml --img 640

模型评估结果包括：

精确度
召回率
mAP（平均精度均值）

7. 实时检测

7.1 实时检测代码

以下是使用YOLOv10进行实时垃圾检测的示例代码：

import cv2
import torch

# 加载模型
model = torch.hub.load('ultralytics/yolov10', 'custom', path='runs/train/exp/weights/best.pt', force_reload=True)

# 打开摄像头
cap = cv2.VideoCapture(0)

while True:
    ret, frame = cap.read()
    if not ret:
        break

    # 进行推理
    results = model(frame)

    # 解析结果
    for *box, conf, cls in results.xyxy[0]:  # detections
        label = f'{model.names[int(cls)]} {conf:.2f}'
        # 绘制边界框
        cv2.rectangle(frame, (int(box[0]), int(box[1])), (int(box[2]), int(box[3])), (255, 0, 0), 2)
        cv2.putText(frame, label, (int(box[0]), int(box[1] - 10)), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)

    # 显示结果
    cv2.imshow('Real-time Garbage Classification', frame)

    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 释放资源
cap.release()
cv2.destroyAllWindows()