基于深度学习的火焰检测系统：UI界面、YOLOv10与数据集的实现

深度学习实战项目

于 2024-10-07 22:08:42 发布

阅读量643

点赞数 12

分类专栏： YOLOv10/v8/v7/v6/v5实战项目文章标签：深度学习 YOLO 人工智能 python ui 计算机视觉火焰检测

本文链接：https://blog.csdn.net/m0_52343631/article/details/142747462

版权

YOLOv10/v8/v7/v6/v5实战项目专栏收录该内容

120 篇文章 0 订阅

订阅专栏

一、引言

火灾是一种破坏力极大的自然或人为灾害，对人类生命、财产和环境都有着极大的威胁。传统的火灾检测方式主要依赖于烟雾传感器和温度传感器，这些传感器虽然能够及时探测到火灾，但却存在诸多不足。例如，它们往往无法在早期的火灾阶段（特别是还没有产生大量烟雾或温度没有明显升高时）做出准确判断。为了解决这一问题，基于计算机视觉的火焰检测技术近年来得到了广泛关注。

深度学习技术，特别是基于卷积神经网络（CNN）的目标检测算法，已经在各类图像识别任务中取得了显著的成果。而YOLO（You Only Look Once）系列模型作为其中的佼佼者，以其高效的实时性和高准确率得到了广泛应用。在本篇博客中，我们将详细介绍如何基于YOLOv10算法实现一个火焰检测系统，并结合UI界面实现数据的实时展示和处理。

二、项目概述

本项目旨在构建一个基于YOLOv10的火焰检测系统，该系统能够实时检测视频或图片中的火焰。系统由以下几个关键部分组成：

YOLOv10模型：用于火焰检测的核心算法。
自定义数据集：包含标注好的火焰图像，用于模型训练。
UI界面：用于实时展示检测结果和与用户进行交互。
数据处理与优化：数据预处理和模型的优化，确保系统的高效性和准确性。

三、YOLOv10简述

YOLO（You Only Look Once）是一种基于深度学习的目标检测算法，它将目标检测任务转换为单一神经网络的回归问题，从而实现高效的实时检测。YOLOv10是YOLO家族的最新版本，它在YOLOv8的基础上做出了许多优化，特别是在模型轻量化、推理速度和检测精度方面取得了显著提升。

YOLOv10具有以下特点：

高效性：通过改进的网络架构和优化算法，YOLOv10的推理速度更快，适用于实时火焰检测任务。
精度：优化的损失函数和更深层的网络结构使得YOLOv10能够在复杂场景中保持高检测精度。
灵活性：YOLOv10支持多种输入尺寸，可以在保证精度的前提下根据硬件环境调整计算需求。

四、数据集准备

要训练YOLOv10火焰检测模型，首先需要一个经过标注的火焰数据集。数据集应该包含各种火焰图像，确保模型能够在不同环境、角度和光照条件下进行检测。我们可以使用现有的公开数据集，也可以通过手动标注的方式构建自定义数据集。

4.1 数据收集

火焰数据集的图像可以从多个来源获取，包括：

公开数据集：如FireNet、Foggia Dataset等。
视频抓帧：从网上的火灾视频中提取帧并进行标注。
手动采集：通过实际拍摄火焰图片。

4.2 数据标注

YOLO模型要求每个训练图像都要对应一个标注文件，标注文件的格式为YOLO格式，包含如下信息：

类别标签：火焰的类别（火焰通常为单一类别，可以设为0）。
边界框坐标：火焰在图片中的边界框，用中心点坐标和宽高表示。

我们可以使用工具如LabelImg或Roboflow进行图像标注，标注完成后会生成对应的txt文件。

4.3 数据集结构

在YOLOv10中，数据集需要遵循特定的目录结构，通常包含如下几个部分：

dataset/
│
├── images/
│   ├── train/  # 训练集图片
│   ├── val/    # 验证集图片
│
├── labels/
│   ├── train/  # 训练集标签
│   ├── val/    # 验证集标签
│
└── data.yaml   # 数据配置文件

其中，data.yaml文件用于指定数据集的相关信息，例如类别数量、训练集和验证集的路径等。

一个典型的data.yaml文件内容如下：

train: ./dataset/images/train
val: ./dataset/images/val
test: ./dataset/images/test

nc: 1  # 类别数目
names: ['fire']  # 类别名称

五、YOLOv10模型训练

5.1 环境配置

在开始模型训练之前，我们需要配置训练环境。这里我们使用Python、PyTorch以及YOLOv10官方提供的训练脚本。可以按照如下步骤进行配置：

安装依赖项：
- PyTorch
- OpenCV
- Numpy
- Matplotlib
- PyYAML
- Tqdm

使用以下命令进行安装：

pip install torch torchvision torchaudio
pip install opencv-python numpy matplotlib pyyaml tqdm

下载YOLOv10代码：从官方仓库或第三方资源下载YOLOv10代码，并放置在工作目录中。

5.2 模型训练

YOLOv10提供了便捷的训练脚本，我们只需要指定数据集路径和相关参数即可开始训练。训练命令如下：

python train.py --data data.yaml --cfg yolov10.yaml --weights '' --batch-size 16 --epochs 50 --img-size 640

其中：

--data：指定数据集的配置文件路径。
--cfg：YOLOv10模型的配置文件。
--weights：初始权重文件路径，这里使用空字符串表示从头开始训练。
--batch-size：每批次的训练图片数，16适合大多数显卡。
--epochs：训练的轮数，更多的轮数可以提升模型性能。
--img-size：输入图片的尺寸。

5.3 模型调优

在训练过程中，我们可以通过调整学习率、批次大小和模型架构来优化模型性能。此外，数据增强（如随机裁剪、旋转、亮度调节等）也能够提升模型的泛化能力。

5.4 模型验证

在训练完成后，我们可以使用验证集对模型进行评估。YOLOv10会自动生成评估报告，包括精确率、召回率和平均精度等指标。

python val.py --data data.yaml --weights best.pt --img-size 640

该命令会输出模型在验证集上的表现，同时生成检测结果的可视化图像。

六、UI界面实现

为了实现火焰检测的实时性和交互性，我们将基于PyQt5或Tkinter来构建一个简单的UI界面。该界面能够加载视频流或图片，实时展示检测结果。

6.1 安装PyQt5

首先，我们需要安装PyQt5库：

pip install pyqt5

6.2 创建主界面

以下是一个简单的UI界面代码示例：

import sys
from PyQt5.QtWidgets import QApplication, QWidget, QLabel, QVBoxLayout, QPushButton
from PyQt5.QtGui import QPixmap
from PyQt5.QtCore import QTimer
import cv2

class FlameDetectionUI(QWidget):
    def __init__(self):
        super().__init__()
        self.setWindowTitle('Flame Detection System')
        self.setGeometry(100, 100, 800, 600)

        self.label = QLabel(self)
        self.label.setGeometry(10, 10, 640, 480)
        
        self.start_button = QPushButton('Start Detection', self)
        self.start_button.setGeometry(10, 500, 150, 40)
        self.start_button.clicked.connect(self.start_detection)
        
        self.timer = QTimer(self)
        self.timer.timeout.connect(self.update_frame)

        self.cap = None

    def start_detection(self):
        self.cap = cv2.VideoCapture(0)  # 打开摄像头
        self.timer.start(30)

    def update_frame(self):
        ret, frame = self.cap.read()
        if ret:
            # 检测火焰并绘制边界框
            # 假设 `detect_fire` 是火焰检测函数
            frame = detect_fire(frame)  
            image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            h, w, ch = image.shape
            bytes_per_line = ch * w
            pixmap = QPixmap.fromImage(QImage(image.data, w, h, bytes_per_line, QImage.Format_RGB888))
            self.label.setPixmap(pixmap)

    def closeEvent(self, event):
        self.cap.release()
        event.accept()

if __name__ == '__main__':
    app = QApplication(sys.argv)
    window = FlameDetectionUI()
    window.show()
    sys.exit(app.exec_())

6.3 火焰检测集成代码

我们假设已经完成了YOLOv10模型的训练，并得到了最终的权重文件best.pt。接下来，我们需要将这个模型加载到系统中，处理每一帧图像并对火焰进行检测。YOLOv10的PyTorch实现提供了方便的接口来加载模型并进行推理。

以下是火焰检测集成的代码，分为以下几个步骤：

加载YOLOv10模型：加载预训练好的权重文件。
实时图像处理：每一帧图像都通过模型进行火焰检测。
绘制边界框：在检测到火焰的区域绘制边界框并显示到UI界面中。

import sys
from PyQt5.QtWidgets import QApplication, QWidget, QLabel, QPushButton
from PyQt5.QtCore import QTimer
import cv2
import torch

# 加载YOLOv10模型
model = torch.hub.load('ultralytics/yolov5', 'custom', path='best.pt', source='local')
model.eval()

def detect_fire(frame):
    # 转换为YOLOv10需要的输入格式
    img = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    results = model(img)  # 进行火焰检测
    
    # 绘制检测结果
    for *box, conf, cls in results.xyxy[0].numpy():
        if cls == 0:  # 火焰类别
            x1, y1, x2, y2 = map(int, box)
            cv2.rectangle(frame, (x1, y1), (x2, y2), (0, 255, 0), 2)  # 绘制边界框
            cv2.putText(frame, f'Fire {conf:.2f}', (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)
    
    return frame

class FlameDetectionUI(QWidget):
    def __init__(self):
        super().__init__()
        self.setWindowTitle('Flame Detection System')
        self.setGeometry(100, 100, 800, 600)

        self.label = QLabel(self)
        self.label.setGeometry(10, 10, 640, 480)
        
        self.start_button = QPushButton('Start Detection', self)
        self.start_button.setGeometry(10, 500, 150, 40)
        self.start_button.clicked.connect(self.start_detection)
        
        self.timer = QTimer(self)
        self.timer.timeout.connect(self.update_frame)

        self.cap = None

    def start_detection(self):
        self.cap = cv2.VideoCapture(0)  # 打开摄像头
        self.timer.start(30)  # 每30ms更新一帧

    def update_frame(self):
        ret, frame = self.cap.read()
        if ret:
            frame = detect_fire(frame)  # 调用火焰检测
            rgb_image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            h, w, ch = rgb_image.shape
            bytes_per_line = ch * w
            qt_image = QImage(rgb_image.data, w, h, bytes_per_line, QImage.Format_RGB888)
            self.label.setPixmap(QPixmap.fromImage(qt_image))

    def closeEvent(self, event):
        self.cap.release()
        event.accept()

if __name__ == '__main__':
    app = QApplication(sys.argv)
    window = FlameDetectionUI()
    window.show()
    sys.exit(app.exec_())