基于深度学习的无人机目标检测系统：YOLOv5/v6/v7/v8/v10模型实现与UI界面集成

深度学习实战项目

于 2024-09-30 23:48:03 发布

阅读量834

点赞数 23

分类专栏： YOLOv10/v8/v7/v6/v5实战项目文章标签：深度学习无人机目标检测人工智能计算机视觉 YOLO ui

本文链接：https://blog.csdn.net/m0_52343631/article/details/142665544

版权

YOLOv10/v8/v7/v6/v5实战项目专栏收录该内容

15 篇文章 0 订阅

订阅专栏

1. 引言

随着无人机技术的迅速发展，其在农业监测、环境保护、交通监控等领域的应用越来越广泛。为了实现对无人机拍摄图像中的目标进行高效、准确的识别，构建一个基于深度学习的目标检测系统显得尤为重要。本文将详细介绍如何利用YOLO（You Only Look Once）系列模型（YOLOv5、YOLOv6、YOLOv7、YOLOv8、YOLOv10）构建无人机目标检测系统，包括数据集准备、模型训练、用户界面设计等内容。

2. 系统架构

2.1 系统模块

本系统主要包括以下模块：

数据集准备：收集与标注无人机图像数据集。
模型训练：使用YOLO模型进行目标检测模型的训练。
用户界面设计：创建用户友好的图形界面。
系统测试与评估：对模型进行测试，评估其性能。

2.2 系统流程图

+-----------------------+
|      数据集准备      |
+-----------------------+
          |
          v
+-----------------------+
|      模型训练        |
+-----------------------+
          |
          v
+-----------------------+
|      用户界面设计    |
+-----------------------+
          |
          v
+-----------------------+
|      系统测试与评估  |
+-----------------------+

3. 数据集准备

3.1 数据集来源

在目标检测任务中，数据集的质量直接影响模型的性能。我们可以通过以下几种方式收集数据：

开源数据集：
- UAVDT: 无人机视频目标检测数据集，包含多种场景和目标。
- UAV123: 包含飞行视角的目标检测数据集。
自定义数据集：
- 使用无人机拍摄特定场景（如农田、建筑物等），记录图像和视频数据。

3.2 数据集标注

为了进行深度学习训练，需要对数据进行标注。我们可以使用LabelImg、CVAT等工具进行标注。以下是标注的步骤：

安装LabelImg：

pip install labelImg

使用LabelImg进行标注：
- 打开LabelImg，选择要标注的图像。
- 添加目标框，标注目标类别（如“人”、“车”、“树”等）。
- 将标注结果保存为YOLO格式。
YOLO格式标注说明：
- 每个标注框的格式为：<class_id> <x_center> <y_center> <width> <height>，所有坐标均相对于图像的宽高进行归一化。

3.3 数据集划分

将数据集划分为训练集、验证集和测试集，常见的划分比例为70%训练，20%验证，10%测试。以下是划分数据集的Python代码：

import os
import shutil
import random

def split_dataset(data_dir, train_ratio=0.7, val_ratio=0.2):
    all_files = os.listdir(data_dir)
    random.shuffle(all_files)
    
    train_size = int(len(all_files) * train_ratio)
    val_size = int(len(all_files) * val_ratio)

    train_files = all_files[:train_size]
    val_files = all_files[train_size:train_size + val_size]
    test_files = all_files[train_size + val_size:]

    # 创建目录
    os.makedirs('train', exist_ok=True)
    os.makedirs('val', exist_ok=True)
    os.makedirs('test', exist_ok=True)

    for file in train_files:
        shutil.copy(os.path.join(data_dir, file), 'train/')

    for file in val_files:
        shutil.copy(os.path.join(data_dir, file), 'val/')

    for file in test_files:
        shutil.copy(os.path.join(data_dir, file), 'test/')

split_dataset('your_dataset_directory/')

4. 模型训练

4.1 YOLO模型介绍

YOLO（You Only Look Once）是一种高效的目标检测算法，它能够在单个网络中同时预测多个目标。我们将使用YOLOv5作为示例，但所述步骤同样适用于YOLOv6、YOLOv7、YOLOv8和YOLOv10。

4.2 安装YOLOv5及依赖

首先，克隆YOLOv5的代码库并安装必要的依赖项：

git clone https://github.com/ultralytics/yolov5.git
cd yolov5
pip install -r requirements.txt

4.3 YAML文件配置

在训练模型之前，需要创建一个YAML配置文件，指定训练和验证数据的路径及类别信息。以下是示例的YAML文件内容：

# data.yaml
train: ./train
val: ./val
test: ./test

nc: 3  # 类别数量，例如：人、车、树
names: ['person', 'car', 'tree']  # 类别名称

4.4 模型训练代码

使用以下代码来训练YOLO模型：

import torch

# 选择模型版本
model_version = 'yolov5s.pt'  # 可以选择 yolov5m.pt, yolov6.pt 等
img_size = 640
batch_size = 16
epochs = 50

# 进行训练
!python train.py --img {img_size} --batch {batch_size} --epochs {epochs} --data data.yaml --weights {model_version}

4.5 训练过程监控

在训练期间，使用TensorBoard等工具监控训练过程，以确保模型收敛并及时调整超参数。

tensorboard --logdir=runs/train

4.6 训练完成后的模型评估

训练完成后，我们可以使用验证集评估模型的性能。以下是一个简单的评估代码示例：

!python val.py --weights runs/train/exp/weights/best.pt --data data.yaml --img {img_size}

5. 用户界面设计

5.1 UI框架选择

在用户界面设计中，我们选择使用Tkinter或PyQt等框架。我们将使用PyQt来构建一个友好的用户界面。

5.2 UI界面代码

以下是一个简单的PyQt用户界面示例代码，可以选择图像或视频文件进行目标检测：

import sys
import cv2
import numpy as np
from PyQt5.QtWidgets import QApplication, QWidget, QVBoxLayout, QPushButton, QLabel, QFileDialog
from PyQt5.QtGui import QPixmap
from yolov5 import YOLOv5  # 假设我们有一个YOLOv5的Python封装

class DroneDetectionApp(QWidget):
    def __init__(self):
        super().__init__()
        self.initUI()
        self.model = YOLOv5("yolov5s.pt")  # 加载训练好的模型

    def initUI(self):
        self.setWindowTitle("无人机目标检测系统")
        self.layout = QVBoxLayout()
        
        self.label = QLabel("选择一个图片或视频进行检测")
        self.layout.addWidget(self.label)

        self.button = QPushButton("选择文件")
        self.button.clicked.connect(self.openFile)
        self.layout.addWidget(self.button)

        self.setLayout(self.layout)

    def openFile(self):
        options = QFileDialog.Options()
        fileName, _ = QFileDialog.getOpenFileName(self, "选择文件", "", "Images (*.png *.xpm *.jpg);;Videos (*.mp4 *.avi)", options=options)
        if fileName:
            self.detectTargets(fileName)

    def detectTargets(self, fileName):
        # 加载并处理图像
        img = cv2.imread(fileName)
        results = self.model.predict(img)
        
        # 在图像上绘制检测结果
        self.drawResults(img, results)

    def drawResults(self, img, results):
        for result in results.pred[0]:
            x1, y1, x2, y2, conf, cls = result
            cv2.rectangle(img, (int(x1), int(y1)), (int(x2), int(y2)), (0, 255, 0), 2)
            cv2.putText(img, f'{self.model.names[int(cls)]} {conf:.2f}', (int(x1), int(y1)-10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)

        # 将结果显示在标签中
        cv2.imwrite("result.jpg", img)
        pixmap = QPixmap("result.jpg")
        self.label.setPixmap(pixmap)

if __name__ == "__main__":
    app = QApplication(sys.argv)
    ex = DroneDetectionApp()
    ex.show()
    sys.exit(app.exec_())

5.3 界面功能

文件选择：用户可以选择一张图片或一个视频文件。
目标检测：加载YOLO模型，对图像进行目标检测并在图像上绘制检测框和类别标签。
结果展示：在界面中展示检测后的图像。

6. 系统测试与性能评估

6.1 性能评估指标

在对模型进行评估时，通常使用以下指标：

准确率（Accuracy）：正确预测的比例。
召回率（Recall）：模型正确识别出目标的能力。
F1分数：准确率和召回率的调和平均数。

6.2 测试代码

使用以下代码来测试训练后的模型性能：

from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score

# 假设有真实标签和模型预测标签
y_true = [...]  # 真实标签
y_pred = [...]  # 模型预测标签

accuracy = accuracy_score(y_true, y_pred)
precision = precision_score(y_true, y_pred, average='weighted')
recall = recall_score(y_true, y_pred, average='weighted')
f1 = f1_score(y_true, y_pred, average='weighted')

print(f'Accuracy: {accuracy:.2f}')
print(f'Precision: {precision:.2f}')
print(f'Recall: {recall:.2f}')
print(f'F1 Score: {f1:.2f}')