基于YOLOv5的火灾烟雾检测系统

今夕是何年，

已于 2023-10-11 13:25:18 修改

阅读量934

点赞数 1

分类专栏： YOLO从入门到精通文章标签： YOLO 目标跟踪人工智能 opencv 计算机视觉图像处理机器学习

于 2023-10-09 15:34:42 首次发布

本文链接：https://blog.csdn.net/qq_53545309/article/details/133703861

版权

YOLO从入门到精通专栏收录该内容

79 篇文章 28 订阅 ¥49.90 ¥99.00

订阅专栏

本文介绍了基于YOLOv5的火灾烟雾检测系统，详述了YOLOv5的算法原理，包括CSPDarknet53主干网络、SPP、PAN和YOLOv5输出层的作用。YOLOv5以其高速、高精度和通用性在目标检测领域表现出色，适用于多种计算机视觉任务。

摘要由CSDN通过智能技术生成

1，YOLOv5算法原理介绍

2，代码实现

3，结果展示

1，YOLOv5算法原理介绍

YOLOv5是目前应用广泛的目标检测算法之一，其主要结构分为两个部分：骨干网络和检测头。

骨干网络采用的是CSPDarknet53，这是一种基于Darknet框架的改进版卷积神经网络。CSPDarknet53通过使用残差结构和跨层连接来提高网络的表达能力，并且采用了空洞空间金字塔池化（ASPP）来实现多尺度的信息提取。这样设计的骨干网络具有较强的特征提取能力，可以有效地提取出图像中的目标信息。

检测头是YOLOv5的另一个关键组成部分，主要用于从骨干网络特征图中提取目标检测信息。它由三个子模块组成：SPP、PAN和YOLOv5输出层。

SPP模块：空洞空间金字塔池化模块，用于对特征图进行多尺度的池化和下采样操作，从而实现对不同大小的目标进行检测。
PAN模块：特征金字塔自上而下的路径，用于将不同层次的特征图融合在一起，并进行上采样操作，以便将低分辨率的特征图与高分辨率的特征图进行融合。
YOLOv5输出层：用于在特征图上进行目标检测，输出目标的类别、边界框位置和置信度等信息。其中，YOLOv5输出层采用特定的损失函数（GIoU和Focal Loss）来优化目标检测的精度和鲁棒性。

总体来说，YOLOv5的主要作用是实现对图像中的目标进行快速、准确的检测。与传统的目标检测算法相比，YOLOv5具有以下优点：

高速：YOLOv5采用了高效的网络结构和检测头，可以实现高速的目标检测。
精度：YOLOv5使用特定的损失函数和多尺度特征提取等技术，可以实现高精度的目标检测。
通用性：YOLOv5能够在不同的场景下进行目标检测，具有较强的通用性和适应性。
易用性：YOLOv5可以通过预训练模型和微调等方法进行快速部署和使用，具有良好的易用性和可扩展性。

总之，YOLOv5是一种优秀的目标检测算法，具有较高的检测速度和精度，适用于各种不同的计算机视觉任务。

输入（Input）: YOLOv5的输入是一张RGB图像，它可以具有不同的分辨率，但通常为416x416或512x512像素。这些图像被预处理和缩放为神经网络的输入大小。在训练过程中，可以使用数据增强技术对图像进行随机裁剪、缩放和翻转等操作，以增加数据的丰富性和多样性。
Backbone（主干网络）: 主干网络负责提取图像的特征表示，它是整个目标检测算法的核心组件。YOLOv5采用了CSPDarknet作为主干网络。CSPDarknet基于Darknet53并进行了改进。它使用了一种被称为CSP（Cross Stage Partial）的结构，将特征映射划分为两个部分，其中一个部分通过一系列卷积和残差连接进行特征提取，另一个部分则直接传递未经处理的特征，从而提高了特征的表达能力和信息传递效率。
Neck（特征融合模块）: Neck模块用于融合来自不同层级的特征图，以获取丰富的语义信息和多尺度感受野。YOLOv5中采用了一种名为PANet（Path Aggregation Network）的结构作为Neck模块。PANet由两个阶段组成：自顶向下路径和自底向上路径。自顶向下路径负责从高级语义层级向低级语义层级传递信息，而自底向上路径则负责从低级语义层级向高级语义层级传递细节信息。通过这样的设计，PANet能够充分利用多层次的特征表示，并有效地融合不同层级的信息。
输出（Output）: YOLOv5的输出是目标检测算法的最终结果，包括检测框（bounding box）、置信度和类别信息。输出的过程经历了一系列的卷积和激活操作。首先，每个网格单元预测一组锚框，每个锚框包含了物体的位置和大小信息。然后，根据锚框和预测的边界框，计算出目标的置信度，反映了该边界框中是否存在目标的概率。最后，使用softmax函数对每个锚框预测的类别分数进行归一化，得到物体属于每个类别的概率。通过这样的输出，可以得到图像中检测到的目标的位置、类别和置信度信息。

综上所述，YOLOv5的输入是图像数据，主干网络负责提取特征，特征融合模块用于融合不同层次的特征图，输出则为目标检测结果，包括检测框、置信度和类别信息。这些组件在算法中发挥着重要的作用，使得YOLOv5能够实现高效准确的目标检测。

2，代码实现

from PyQt5.QtWidgets import QApplication, QMainWindow, QFileDialog, QMenu, QAction
from main_win.win import Ui_mainWindow
from PyQt5.QtCore import Qt, QPoint, QTimer, QThread, pyqtSignal
from PyQt5.QtGui import QImage, QPixmap, QPainter, QIcon

import sys
import os
import json
import numpy as np
import torch
import torch.backends.cudnn as cudnn
import os
import time
import cv2

from models.experimental import attempt_load
from utils.datasets import LoadImages, LoadWebcam
from utils.CustomMessageBox import MessageBox
# LoadWebcam 的最后一个返回值改为 self.cap
from utils.general import check_img_size, check_requirements, check_imshow, colorstr, non_max_suppression, \
    apply_classifier, scale_coords, xyxy2xywh, strip_optimizer, set_logging, increment_path, save_one_box
from utils.plots import colors, plot_one_box, plot_one_box_PIL
from utils.torch_utils import select_device, load_classifier, time_sync
from utils.capnums import Camera
from dialog.rtsp_win import Window


class DetThread(QThread):
    send_img = pyqtSignal(np.ndarray)
    send_raw = pyqtSignal(np.ndarray)
    send_statistic = pyqtSignal(dict)
    # 发送信号：正在检测/暂停/停止/检测结束/错误报告
    send_msg = pyqtSignal(str)
    send_percent = pyqtSignal(int)
    send_fps = pyqtSignal(str)

    def __init__(self):
        super(DetThread, self).__init__()
        self.weights = './yolov5s.pt'           # 设置权重
        self.current_weight = './yolov5s.pt'    # 当前权重
        self.source = '0'                       # 视频源
        self.conf_thres = 0.25                  # 置信度
        self.iou_thres = 0.45                   # iou
        self.jump_out = False                   # 跳出循环
        self.is_continue = True                 # 继续/暂停
        self.percent_length = 1000              # 进度条
        self.rate_check = True                  # 是否启用延时
        self.rate = 100                         # 延时HZ
        self.save_fold = './result'             # 保存文件夹

    @torch.no_grad()
    def run(self,
            imgsz=640,  # inference size (pixels)
            max_det=1000,  # maximum detections per image
            device='',  # cuda device, i.e. 0 or 0,1,2,3 or cpu
            view_img=True,  # show results
            save_txt=False,  # save results to *.txt
            save_conf=False,  # save confidences in --save-txt labels
            save_crop=False,  # save cropped prediction boxes
            nosave=False,  # do not save images/videos
            classes=None,  # filter by class: --class 0, or --class 0 2 3
            agnostic_nms=False,  # class-agnostic NMS
            augment=False,  # augmented inference
            visualize=False,  # visualize features
            update=False,  # update all models
            project='runs/detect',  # save results to project/name
            name='exp',  # save results to project/name
            exist_ok=False,  # existing project/name ok, do not increment
            line_thickness=3,  # bounding box thickness (pixels)
            hide_labels=False,  # hide labels
            hide_conf=False,  # hide confidences
            half=False,  # use FP16 half-precision inference
            ):

        # Initialize
        try:
            device = select_device(device)
            half &= device.type != 'cpu'  # half precision only supported on CUDA

            # Load model
            model = attempt_load(self.weights, map_location=device)  # load FP32 model
            num_params = 0
            for param in model.parameters():
                num_params += param.numel()
            stride = int(model.stride.max())  # model stride
            imgsz = check_img_size(imgsz, s=stride)  # check image size
            names = model.module.names if hasattr(model, 'module') else model.names  # get class names
            if half:
                model.half()  # to FP16

            # Dataloader
            if self.source.isnumeric() or self.source.lower().startswith(('rtsp://', 'rtmp://', 'http://', 'https://')):
                view_img = check_imshow()
                cudnn.benchmark = True  # set True to speed up constant image size inference
                dataset = LoadWebcam(self.source, img_size=imgsz, stride=stride)
                # bs = len(dataset)  # batch_size
            else:
                dataset = LoadImages(self.source, img_size=imgsz, stride=stride)

            # Run inference
            if device.type != 'cpu':
                model(torch.zeros(1, 3, imgsz, imgsz).to(device).type_as(next(model.parameters())))  # run once
            count = 0
            # 跳帧检测
            jump_count = 0
            start_time = time.time()
            dataset = iter(dataset)

            while True:
                # 手动停止
                if self.jump_out:
                    self.vid_cap.release()
                    self.send_percent.emit(0)
                    self.send_msg.emit('停止')
                    if hasattr(self, 'out'):
                        self.out.release()
                    break