基于深度学习的交通信号标志识别系统：使用YOLOv10、UI界面及自定义数据集的实现

深度学习实战项目

于 2024-10-07 22:35:36 发布

阅读量448

点赞数 6

分类专栏： YOLOv10/v8/v7/v6/v5实战项目文章标签：深度学习 YOLO ui 人工智能目标检测图像处理计算机视觉

本文链接：https://blog.csdn.net/m0_52343631/article/details/142747965

版权

YOLOv10/v8/v7/v6/v5实战项目专栏收录该内容

120 篇文章 0 订阅

订阅专栏

引言

随着智能交通技术的发展，交通信号标志识别系统的应用越来越广泛。这样的系统能够帮助自动驾驶汽车、智能监控系统等理解交通环境，从而做出更安全的行驶决策。本博客将详细介绍如何构建一个基于YOLOv10的交通信号标志识别系统，包括数据集的准备、模型的训练与评估，以及用户界面的设计与实现。希望通过本博客，读者能够掌握如何使用深度学习进行交通标志识别。

一、系统概述

1.1 系统目标

本系统的主要目标是：

交通信号标志检测：能够实时检测图像中的交通信号标志。
信号标志分类：识别不同类型的交通信号标志，如停车标志、限速标志等。
用户友好的界面：提供简洁的UI，方便用户上传图像或视频进行检测。

1.2 系统结构

系统的整体结构如下图所示：

┌────────────────────────┐
│   数据准备与标注        │
├────────────────────────┤
│   YOLOv10模型训练       │
├────────────────────────┤
│   实时检测与计数       │
├────────────────────────┤
│   用户界面              │
└────────────────────────┘

二、YOLOv10算法概述

2.1 YOLOv10简介

YOLO（You Only Look Once）是一种高效的目标检测算法，其在准确性和速度之间取得了良好的平衡。YOLOv10作为最新版本，采用了更先进的网络结构和训练方法，使得其在各种环境下的表现更加出色。

2.2 YOLOv10的主要特点

快速检测：YOLOv10能够实现实时目标检测，适合在动态环境中使用。
多尺度特征融合：通过多层次特征的融合，YOLOv10可以有效处理不同大小的目标。
易于使用：提供简洁的API，方便用户进行模型训练和推理。

三、数据集准备

3.1 数据集选择

对于交通信号标志识别，我们可以使用以下数据集：

GTSRB（German Traffic Sign Recognition Benchmark）：包含多种德国交通信号标志的图像，是一个常用的交通标志数据集。
LISA（Large-scale dataset for Traffic Sign Recognition）：包含多种类型的交通信号标志。

本项目将使用GTSRB数据集。

3.2 数据集格式

YOLOv10要求数据集按特定格式组织。每个图像文件对应一个文本文件，该文本文件包含标注信息。每行格式如下：

[class_id] [x_center] [y_center] [width] [height]

class_id：标志类别ID（从0开始）。
x_center、y_center：边界框中心点的归一化坐标（范围在0到1之间）。
width、height：边界框的宽度和高度，归一化到图像尺寸。

3.3 `data.yaml`文件

data.yaml文件用于定义数据集的结构。以下是该文件的示例：

train: /path/to/your/dataset/train/images
val: /path/to/your/dataset/val/images

nc: 43
names: ['speed_limit_20', 'speed_limit_30', 'speed_limit_50', 'stop', 'yield', ...]  # 依次列出所有类别

train和val分别表示训练集和验证集的路径。
nc表示类别数量（此处为43）。
names为类别名称，依次列出所有的交通信号标志类型。

四、环境配置

4.1 软件环境

在进行模型训练和推理之前，需要配置以下环境：

Python版本：建议使用Python 3.8或以上版本。
依赖库：安装PyTorch、OpenCV等必要库。

pip install torch torchvision opencv-python matplotlib

4.2 硬件环境

为了加速模型训练，建议使用支持CUDA的GPU。显存越大，能够处理的batch size也越大。

五、模型训练

5.1 加载数据集

首先需要加载和预处理数据集。以下是加载数据集的示例代码：

import os
import cv2
import numpy as np
from pathlib import Path

def load_yolo_dataset(dataset_path):
    images = []
    labels = []
    for img_path in Path(dataset_path).glob('*.jpg'):
        image = cv2.imread(str(img_path))
        images.append(image)
        
        # 读取相应的标签文件
        label_path = img_path.with_suffix('.txt')
        if label_path.exists():
            with open(label_path, 'r') as f:
                label_data = f.readlines()
                label = [list(map(float, line.strip().split())) for line in label_data]
                labels.append(label)
    return images, labels

5.2 模型初始化

接下来，初始化YOLOv10模型的代码如下：

from yolov10 import YOLOv10

# 初始化YOLOv10模型
model = YOLOv10(model_cfg="yolov10.yaml", num_classes=43)

5.3 训练模型

以下是训练模型的示例代码：

epochs = 100
batch_size = 16
learning_rate = 0.001

# 加载数据集
train_images, train_labels = load_yolo_dataset('/path/to/your/dataset/train/images')
val_images, val_labels = load_yolo_dataset('/path/to/your/dataset/val/images')

# 训练模型
model.train(train_images, train_labels, val_images, val_labels, epochs=epochs, batch_size=batch_size, lr=learning_rate)

# 保存模型
model.save("yolov10_traffic_signs.pt")

5.4 模型评估

使用验证集评估模型性能：

# 评估模型
metrics = model.evaluate(val_images, val_labels)
print(f"Validation mAP: {metrics['mAP']:.2f}")

六、实时检测与计数

6.1 实时检测代码

以下代码用于实时检测交通信号标志：

import cv2

def detect_and_count(video_source=0):
    cap = cv2.VideoCapture(video_source)
    sign_count = {i: 0 for i in range(43)}  # 初始化信号标志计数

    while cap.isOpened():
        ret, frame = cap.read()
        if not ret:
            break

        results = model.predict(frame)

        for result in results:
            x1, y1, x2, y2 = result['box']
            class_id = result['class_id']
            sign_count[class_id] += 1
            cv2.rectangle(frame, (x1, y1), (x2, y2), (0, 255, 0), 2)

        for sign_id, count in sign_count.items():
            cv2.putText(frame, f'Sign {sign_id}: {count}', (10, 30 + sign_id * 20), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), 1)

        cv2.imshow('Detection', frame)

        if cv2.waitKey(1) & 0xFF == ord('q'):
            break

    cap.release()
    cv2.destroyAllWindows()

detect_and_count()

七、用户界面设计

7.1 UI框架选择

为了提供用户友好的体验，选择Tkinter作为UI框架。用户可以通过界面上传图像或视频进行检测。

7.2 UI实现代码

以下是UI界面的实现代码：

import tkinter as tk
from tkinter import filedialog
import cv2
from PIL import Image, ImageTk

# 创建Tkinter窗口
window = tk.Tk()
window.title("交通信号标志识别系统")

# 上传视频按钮
def upload_video():
    file_path = filedialog.askopenfilename(filetypes=[("Video Files", "*.mp4;*.avi")])
    if file_path:
        detect_and_count(file_path)

# 显示检测结果
def show_image(img):
    img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    img_pil = Image.fromarray(img_rgb)
    img_tk = ImageTk.PhotoImage(image=img_pil)
    label.config(image=img_tk)
    label.image = img_tk

# 布局
upload_video_btn = tk.Button(window, text="上传视频", command=upload_video)
upload_video_btn.pack()

label = tk.Label(window)
label.pack()

window.mainloop()