基于深度学习的水果识别系统：YOLOv5/v6/v7/v8/v10模型实现与UI界面集成

最新推荐文章于 2024-09-30 23:48:03 发布

深度学习实战项目

最新推荐文章于 2024-09-30 23:48:03 发布

阅读量507

点赞数 9

分类专栏： YOLOv10/v8/v7/v6/v5实战项目文章标签：深度学习 YOLO ui python 水果识别系统人工智能代码

本文链接：https://blog.csdn.net/m0_52343631/article/details/142664804

版权

YOLOv10/v8/v7/v6/v5实战项目专栏收录该内容

15 篇文章 0 订阅

订阅专栏

YOLOv5 配置文件 fruits.yaml（数据集配置）

YOLOv5 配置文件 yolov5.yaml（模型架构配置）

随着深度学习和计算机视觉的发展，自动化图像分类和识别任务在各个领域都有着广泛的应用。水果识别作为计算机视觉任务之一，利用YOLO（You Only Look Once）系列算法可以实现高效、准确的目标检测。在本篇博客中，我们将讨论如何利用YOLOv5及以上版本（YOLOv6、YOLOv7、YOLOv8、YOLOv10）搭建一个基于UI界面的水果识别系统。

1. YOLO简介

YOLO 是一种广受欢迎的目标检测算法，最初由 Joseph Redmon 提出，具备实时性好、精度高的特点。YOLO将目标检测问题转化为回归问题，通过单个神经网络直接预测物体的类别和边界框。YOLO 的最大优势是速度快，非常适合在实时系统中进行部署。

YOLO系列的迭代

YOLOv5：广泛应用于多种视觉任务的实时检测，速度快，精度适中。
YOLOv6：提升了精度，同时在移动设备上的性能进行了优化。
YOLOv7：提出了新的架构，极大提高了检测速度与精度。
YOLOv8：通过进一步优化网络结构，使得模型在速度和精度上达到新的平衡。
YOLOv10：最新版本，结合了YOLO系列的优点，并使用了新的训练策略和特征提取网络，进一步提高检测性能。

2. YOLOv5及以上版本的特点

YOLOv5

YOLOv5 作为开源项目，设计简单，代码容易修改，拥有丰富的预训练模型，便于用户快速上手。在大多数目标检测任务中，YOLOv5 具有较好的性能表现。

YOLOv6

YOLOv6 在YOLOv5的基础上优化了模型参数，采用了新的检测头，增强了对小目标的检测能力，并在推理速度上进一步提升。

YOLOv7

YOLOv7 引入了 "Extended E-ELAN" 网络结构，这使得模型可以在保持较高检测速度的同时，进一步提升检测精度。

YOLOv8

YOLOv8 采用了新的锚框机制和更高效的特征提取网络，极大增强了模型的检测效果，特别是在复杂场景中的表现尤为突出。

YOLOv10

YOLOv10 是YOLO系列的最新版本，通过引入新型的激活函数和多尺度特征融合模块，提升了模型的泛化能力，并且支持更大分辨率的输入图像，提高了复杂场景中的识别能力。

3. 构建UI界面

为了更好地展示水果识别结果，我们将使用 tkinter 构建一个简单的图形用户界面（GUI）。用户可以通过界面加载图片，并实时查看YOLO模型对水果的识别结果。

tkinter界面设计

import tkinter as tk
from tkinter import filedialog
from PIL import Image, ImageTk

class FruitRecognitionApp:
    def __init__(self, root):
        self.root = root
        self.root.title("水果识别系统")
        self.root.geometry("800x600")

        # 上传按钮
        self.upload_button = tk.Button(root, text="上传图片", command=self.upload_image)
        self.upload_button.pack()

        # 显示图片区域
        self.canvas = tk.Canvas(root, width=600, height=400)
        self.canvas.pack()

        # 识别结果显示
        self.result_label = tk.Label(root, text="识别结果：", font=("Arial", 14))
        self.result_label.pack()

    def upload_image(self):
        file_path = filedialog.askopenfilename()
        if file_path:
            img = Image.open(file_path)
            img = img.resize((600, 400))
            img = ImageTk.PhotoImage(img)
            self.canvas.create_image(0, 0, anchor=tk.NW, image=img)
            self.root.mainloop()

if __name__ == "__main__":
    root = tk.Tk()
    app = FruitRecognitionApp(root)
    root.mainloop()

通过该界面，用户可以选择要识别的图片，并且显示在界面上，随后将其传入YOLO模型进行检测。

4. YOLO模型配置（YAML文件）

在训练YOLO模型之前，我们需要定义数据集的配置文件和模型的架构。YAML 文件用于配置模型的结构和数据集路径。

YOLOv5 配置文件 `fruits.yaml`（数据集配置）

train: ../datasets/fruits/train/images
val: ../datasets/fruits/val/images

nc: 5  # 类别数，这里假设有5种水果
names: ['apple', 'banana', 'orange', 'grape', 'pineapple']

YOLOv5 配置文件 `yolov5.yaml`（模型架构配置）

# YOLOv5模型的基本配置
nc: 5  # 类别数
depth_multiple: 0.33  # 模型深度
width_multiple: 0.50  # 模型宽度

anchors:
  - [10,13, 16,30, 33,23]  # P3/8
  - [30,61, 62,45, 59,119]  # P4/16
  - [116,90, 156,198, 373,326]  # P5/32

backbone:
  - [-1, 1, Focus, [64, 3]]  # 输入层
  - [-1, 1, Conv, [128, 3, 2]]  # 下采样
  - [-1, 3, BottleneckCSP, [128]]
  - [-1, 1, Conv, [256, 3, 2]]  # 下采样
  - [-1, 9, BottleneckCSP, [256]]
  - [-1, 1, Conv, [512, 3, 2]]  # 下采样
  - [-1, 9, BottleneckCSP, [512]]
  - [-1, 1, Conv, [1024, 3, 2]]  # 下采样
  - [-1, 1, SPP, [1024, [5, 9, 13]]]
  - [-1, 3, BottleneckCSP, [1024, False]]  # 输出层

上述配置文件用于定义YOLOv5的网络架构以及所使用的数据集。在数据集配置中，我们指定了水果的种类及路径；而在模型配置中，我们定义了模型的层数、深度、锚框等。

5. YOLO模型训练与测试

环境配置

首先，确保已经安装了以下依赖库：

pip install torch torchvision torchaudio
pip install opencv-python-headless
pip install matplotlib pyyaml

模型训练

在完成配置文件后，我们可以通过以下命令进行模型训练：

python train.py --img 640 --batch 16 --epochs 50 --data fruits.yaml --cfg yolov5.yaml --weights yolov5s.pt --device 0

--img：图像输入尺寸。
--batch：每批次的样本数量。
--epochs：训练的轮次。
--data：数据集的配置文件。
--cfg：模型架构配置文件。
--weights：预训练模型的权重。
--device：指定使用的设备。

模型测试

训练完成后，可以通过以下命令对模型进行测试：

python detect.py --source path/to/test/images --weights runs/train/exp/weights/best.pt --img 640

6. UI集成YOLO模型进行水果识别

在UI界面中，我们可以将YOLO模型的推理结果集成到水果识别系统中。以下是将模型加载并应用到UI中的关键代码片段。

YOLO推理集成代码

import torch
from models.experimental import attempt_load
from utils.general import non_max_suppression
from utils.datasets import letterbox

class YOLOFruitDetector:
    def __init__(self, model_path):
        self.device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
        self.model = attempt_load(model_path, map_location=self.device)

    def detect(self, image_path):
        # 预处理图片
        img = letterbox(image_path, 640)[0]
        img = img.transpose((2, 0, 1))
        img = torch.from_numpy(img).to(self.device)
        img = img.float() / 255.0  # 标准化
        if img.ndimension() == 3:
            img = img.unsqueeze(0)

        # 推理
        pred = self.model(img)[0]
        pred = non_max_suppression(pred, 0.25, 0.45)
        
        return pred  # 返回预测结果

在上面的代码中，YOLOFruitDetector 类负责加载 YOLO 模型并对上传的图片进行水果识别。识别结果会被返回并显示在UI界面中。

7. 代码实现

import tkinter as tk
from tkinter import filedialog
from PIL import Image, ImageTk
from YOLOFruitDetector import YOLOFruitDetector  # YOLO模型集成类

class FruitRecognitionApp:
    def __init__(self, root):
        self.root = root
        self.root.title("水果识别系统")
        self.root.geometry("800x600")

        # 上传按钮
        self.upload_button = tk.Button(root, text="上传图片", command=self.upload_image)
        self.upload_button.pack()

        # 显示图片区域
        self.canvas = tk.Canvas(root, width=600, height=400)
        self.canvas.pack()

        # 识别结果显示
        self.result_label = tk.Label(root, text="识别结果：", font=("Arial", 14))
        self.result_label.pack()

        # 加载YOLO模型
        self.detector = YOLOFruitDetector('runs/train/exp/weights/best.pt')

    def upload_image(self):
        file_path = filedialog.askopenfilename()
        if file_path:
            img = Image.open(file_path)
            img = img.resize((600, 400))
            img = ImageTk.PhotoImage(img)
            self.canvas.create_image(0, 0, anchor=tk.NW, image=img)

            # 进行YOLO识别
            result = self.detector.detect(file_path)
            self.result_label.config(text=f"识别结果：{result}")

if __name__ == "__main__":
    root = tk.Tk()
    app = FruitRecognitionApp(root)
    root.mainloop()