基于深度学习的景区垃圾识别系统：YOLOv5/v6/v7/v8/v10模型实现与UI界面集成

最新推荐文章于 2024-10-02 15:08:23 发布

深度学习实战项目

最新推荐文章于 2024-10-02 15:08:23 发布

阅读量824

点赞数 17

分类专栏： YOLOv10/v8/v7/v6/v5实战项目文章标签：深度学习 YOLO 人工智能 ui python 计算机视觉

本文链接：https://blog.csdn.net/m0_52343631/article/details/142681610

版权

YOLOv10/v8/v7/v6/v5实战项目专栏收录该内容

50 篇文章 0 订阅

订阅专栏

1. 引言

随着社会的发展和人们环保意识的提升，景区垃圾管理逐渐受到重视。传统的垃圾管理方法往往依赖人工巡查，不仅效率低下，而且难以实时监控。借助深度学习技术，特别是目标检测算法，能够实现对景区垃圾的自动识别与分类，从而提升管理效率。

本文将详细介绍如何构建一个基于YOLO系列模型（YOLOv5、YOLOv6、YOLOv7、YOLOv8、YOLOv10）的景区垃圾识别系统。系统包括数据集准备、模型训练、UI界面设计及代码实现等方面，力求提供一个完整、详细的实现方案。

2. 系统概述

本系统旨在通过实时视频监控和图像处理，实现对景区垃圾的自动识别与分类。主要功能包括：

垃圾识别：能够检测图像中的垃圾种类。
实时监控：支持实时视频流处理，适用于景区环境监测。
用户友好的UI界面：便于用户操作与结果查看。
数据统计：记录识别结果，提供管理决策支持。

3. 数据集准备

3.1 数据集选择

为了训练一个高效的垃圾识别模型，我们需要合适的数据集。可以选择以下数据集：

垃圾数据集：可从Kaggle等平台找到相关的垃圾数据集，如“TrashNet”数据集。
自定义数据集：如果现有数据集不符合需求，可以自行拍摄并标注垃圾图像。

3.2 数据集格式

我们将数据集组织为YOLO格式，目录结构如下：

dataset/
│
├── images/
│   ├── train/
│   ├── val/
│
└── labels/
    ├── train/
    ├── val/

每个图像文件应有一个对应的标签文件，标签文件格式如下：

<class_id> <x_center> <y_center> <width> <height>

其中：

<class_id>：类别ID，从0开始。
<x_center>、<y_center>：目标中心点坐标，相对图像宽度和高度的比例。
<width>、<height>：目标宽度和高度，相对图像宽度和高度的比例。

3.3 data.yaml 文件

以下是一个示例 data.yaml 文件的内容，用于定义数据集的路径和类别信息：

train: dataset/images/train
val: dataset/images/val

nc: 5
names: ['plastic_bottle', 'paper', 'glass', 'metal_can', 'food']

在此示例中，nc 表示类别数量，names 列出了不同类型的垃圾。

4. YOLO模型选择与训练

4.1 YOLO模型简介

YOLO（You Only Look Once）模型是一种高效的目标检测算法，可以在单个前向传播中完成目标检测。根据具体需求，我们可以选择YOLOv5、YOLOv6、YOLOv7、YOLOv8或YOLOv10模型进行训练。

YOLOv5：在检测速度和准确度方面具有良好的平衡，广泛应用于各类目标检测任务。
YOLOv6：相较于YOLOv5，在速度上进一步优化，适用于实时应用场景。
YOLOv7：在模型结构上做了创新，提供了更高的检测精度。
YOLOv8：进一步优化的版本，具有更好的泛化能力和效率。
YOLOv10：最新的YOLO模型，结合了多种优化策略，适合复杂场景下的检测任务。

4.2 环境配置

首先，我们需要安装YOLOv5及其相关依赖项。以YOLOv5为例，可以通过以下命令进行安装：

git clone https://github.com/ultralytics/yolov5.git
cd yolov5
pip install -r requirements.txt

如果要使用YOLOv6、YOLOv7、YOLOv8或YOLOv10，也可以根据相应的GitHub仓库进行安装。

4.3 训练模型

训练YOLO模型的过程包括数据加载、模型初始化和训练循环。以下是训练YOLOv5模型的示例代码：

import subprocess

def train_yolov5(data_yaml_path, weights_path='yolov5s.pt', img_size=640, epochs=50, batch_size=16):
    command = [
        'python', 'train.py',
        '--img', str(img_size),
        '--batch', str(batch_size),
        '--epochs', str(epochs),
        '--data', data_yaml_path,
        '--cfg', 'models/yolov5.yaml',
        '--weights', weights_path
    ]
    subprocess.run(command)

# 训练YOLOv5
train_yolov5('data.yaml')

4.4 模型评估

训练完成后，需要评估模型的性能。可以通过以下代码实现模型评估：

def evaluate_model(weights_path, data_yaml_path):
    command = [
        'python', 'val.py',
        '--weights', weights_path,
        '--data', data_yaml_path
    ]
    subprocess.run(command)

# 评估模型
evaluate_model('runs/train/exp/weights/best.pt', 'data.yaml')

5. UI界面设计

为了方便用户使用该系统，我们将使用PyQt5设计一个简单的UI界面。用户可以选择视频源（如摄像头或本地视频文件），系统会实时检测垃圾。

5.1 安装PyQt5

首先需要安装PyQt5库：

pip install PyQt5

5.2 UI界面代码

以下是创建UI界面的代码示例：

import sys
import cv2
import numpy as np
from PyQt5.QtWidgets import QApplication, QWidget, QVBoxLayout, QPushButton, QLabel, QFileDialog
from PyQt5.QtGui import QPixmap, QImage
from PyQt5.QtCore import QTimer
from models.experimental import attempt_load
from utils.general import non_max_suppression

class TrashDetectionUI(QWidget):
    def __init__(self):
        super().__init__()
        self.initUI()
        self.video_capture = None

    def initUI(self):
        self.setWindowTitle('景区垃圾识别系统')
        layout = QVBoxLayout()

        self.label = QLabel(self)
        self.label.setText('请加载视频源')
        layout.addWidget(self.label)

        self.btn_load_file = QPushButton('加载文件', self)
        self.btn_load_file.clicked.connect(self.load_file)
        layout.addWidget(self.btn_load_file)

        self.setLayout(layout)

    def load_file(self):
        file_path, _ = QFileDialog.getOpenFileName(self, '选择文件', '', 'Videos (*.mp4 *.avi)')
        if file_path:
            self.start_video_detection(file_path)

    def start_video_detection(self, video_path):
        self.video_capture = cv2.VideoCapture(video_path)
        timer = QTimer(self)
        timer.timeout.connect(self.process_frame)
        timer.start(30)

    def load_model(self):
        return attempt_load('runs/train/exp/weights/best.pt', map_location='cpu')

    def run_detection(self, img):
        model = self.load_model()
        results = model(img)
        detections = non_max_suppression(results, conf_thres=0.4)
        return detections

    def process_frame(self):
        if self.video_capture.isOpened():
            ret, frame = self.video_capture.read()
            if ret:
                detections = self.run_detection(frame)
                self.display_results(frame, detections)

    def display_results(self, image, detections):
        for det in detections:
            if det is not None:
                for *xyxy, conf, cls in reversed(det):
                    label = f'{cls} {conf:.2f}'
                    cv2.rectangle(image, (int(xyxy[0]), int(xyxy[1])), (int(xyxy[2]), int(xyxy[3])), (0, 255, 0), 2)
                    cv2.putText(image, label, (int(xyxy[0]), int(xyxy[1] - 10)), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)

        # 显示图像
        height, width, channel = image.shape
        bytes_per_line = 3 * width
        q_image = QImage(image.data, width, height, bytes_per_line, QImage.Format_RGB888)
        self.label.setPixmap(QPixmap.fromImage(q_image))

if __name__ == '__main__':
    app = QApplication(sys.argv)
    ui = TrashDetectionUI()
    ui.show()
    sys.exit(app.exec_())