基于深度学习的商品标签识别系统：YOLOv5/v6/v7/v8/v10模型实现与UI界面集成

深度学习实战项目

于 2024-10-04 13:33:56 发布

阅读量307

点赞数 10

分类专栏： YOLOv10/v8/v7/v6/v5实战项目文章标签：深度学习 YOLO 人工智能 ui 计算机视觉

本文链接：https://blog.csdn.net/m0_52343631/article/details/142702439

版权

YOLOv10/v8/v7/v6/v5实战项目专栏收录该内容

75 篇文章 0 订阅

订阅专栏

在当今快节奏的商业环境中，商品标签识别系统不仅提高了库存管理的效率，还能加速销售流程。通过深度学习技术，特别是YOLO（You Only Look Once）系列模型，我们能够实现实时、高效的商品标签检测。本博客将详细介绍如何构建一个基于YOLOv5（或其他版本如YOLOv6/v7/v8/v10）的商品标签识别系统，包括其UI界面的设计和实现，训练数据集的准备，以及完整的代码示例。

1. 项目概述

1.1 背景

商品标签识别系统能够自动识别商品上的标签信息，如价格、条形码、商品名称等，这对于零售商和库存管理尤为重要。YOLO系列模型因其快速和高效的目标检测能力而成为该领域的首选。

1.2 项目目标

实现商品标签的实时识别。
开发一个用户友好的UI界面，方便用户操作。
准备并使用合适的数据集进行模型训练。

2. 环境准备

2.1 软件需求

Python 3.7+
PyTorch 1.7.0+
OpenCV
Flask 或其他UI框架（如 PyQt5）
YOLOv5（或YOLOv6/v7/v8/v10）

2.2 硬件需求

GPU（NVIDIA RTX系列推荐）
至少16GB的RAM
适当的存储空间（至少10GB）

3. 数据集准备

为了训练我们的YOLO模型，我们需要一个包含商品标签的图像数据集。以下是数据集准备的步骤：

3.1 收集数据

可以使用公开数据集或自行拍摄商品标签图像。确保数据集包含各种商品标签，以提高模型的泛化能力。

3.2 数据标注

使用标注工具（如LabelImg）对图像进行标注。YOLO要求标注文件为 .txt 格式，每个图像对应一个 .txt 文件，其中包含每个标签的类别和坐标信息。

3.3 data.yaml 文件

在YOLOv5中，您需要创建一个 data.yaml 文件来描述数据集的结构。以下是一个示例：

train: /path/to/train/images
val: /path/to/val/images

nc: 10  # 类别数量
names: ['price_tag', 'barcode', 'product_name', 'discount_label', 'expiry_date', 'organic', 'imported', 'gluten_free', 'vegan', 'kosher']

3.4 数据集结构

数据集的文件结构应该如下：

dataset/
    ├── images/
    │   ├── train/
    │   ├── val/
    ├── labels/
    │   ├── train/
    │   ├── val/
    ├── data.yaml

4. 模型训练

4.1 YOLOv5 安装

首先，克隆YOLOv5的官方GitHub仓库并安装所需的依赖项：

git clone https://github.com/ultralytics/yolov5.git
cd yolov5
pip install -r requirements.txt

4.2 训练模型

在命令行中，您可以使用以下命令来训练YOLOv5模型：

python train.py --img 640 --batch 16 --epochs 50 --data data.yaml --weights yolov5s.pt

--img：输入图像的尺寸。
--batch：每个训练批次的样本数量。
--epochs：训练轮次。
--data：指向 data.yaml 文件的路径。
--weights：选择的预训练权重（这里使用 yolov5s.pt）。

4.3 模型评估

训练完成后，可以使用以下命令评估模型性能：

python val.py --data data.yaml --weights runs/train/exp/weights/best.pt --img 640

5. UI 界面设计

5.1 选择框架

对于用户界面的设计，我们可以使用 Flask、Tkinter 或 PyQt5。这里以 Flask 为例。

5.2 Flask 项目结构

flask_app/
    ├── static/
    │   └── styles.css
    ├── templates/
    │   └── index.html
    ├── app.py
    ├── yolov5/
    └── requirements.txt

5.3 创建 Flask 应用

在 app.py 中，设置基本的Flask应用：

from flask import Flask, render_template, request
import cv2
import torch

app = Flask(__name__)

# 加载模型
model = torch.hub.load('ultralytics/yolov5', 'custom', path='runs/train/exp/weights/best.pt')

@app.route('/')
def index():
    return render_template('index.html')

@app.route('/predict', methods=['POST'])
def predict():
    if request.method == 'POST':
        file = request.files['file']
        img = cv2.imdecode(np.fromstring(file.read(), np.uint8), cv2.IMREAD_COLOR)

        # 进行预测
        results = model(img)
        results.save()  # 保存预测结果
        return render_template('index.html', results=results.pandas().xyxy[0])

if __name__ == '__main__':
    app.run(debug=True)

5.4 HTML 模板

在 templates/index.html 中，创建一个简单的上传表单：

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <link rel="stylesheet" href="{{ url_for('static', filename='styles.css') }}">
    <title>商品标签识别</title>
</head>
<body>
    <h1>商品标签识别系统</h1>
    <form action="/predict" method="post" enctype="multipart/form-data">
        <input type="file" name="file" accept="image/*">
        <button type="submit">上传并识别</button>
    </form>
    {% if results %}
        <h2>识别结果</h2>
        <ul>
        {% for result in results %}
            <li>{{ result }}</li>
        {% endfor %}
        </ul>
    {% endif %}
</body>
</html>

5.5 CSS 样式

在 static/styles.css 中，添加一些基本样式：

body {
    font-family: Arial, sans-serif;
    margin: 20px;
}

h1 {
    color: #333;
}

form {
    margin-bottom: 20px;
}

input[type="file"] {
    margin-right: 10px;
}