yolov8+2024sota_reid+行人重识别+车辆重识别【代码说明】

热血小蚂蚁

已于 2024-05-16 10:56:50 修改

阅读量1.9k

点赞数 18

分类专栏：基于大模型VIT的车辆重识别文章标签： YOLO yolov8 python 图像处理人工智能

于 2024-05-16 10:51:14 首次发布

本文链接：https://blog.csdn.net/hard_level/article/details/138951697

版权

基于大模型VIT的车辆重识别专栏收录该内容

4 篇文章

订阅专栏

代码地址

基于visual transformer的车辆重识别(vehicle reid)系统
 2024最强SoTA行人重识别(ReID)项目实战

要理解我的行人重识别（ReID）相关代码的解释，需要具备以下基础能力：

Python基础能力：

熟悉Python语法、数据结构、函数和面向对象编程。
能够使用Python进行数据处理和简单的算法实现。

深度学习的基础知识：

理解深度学习的基本概念和原理，如神经网络、反向传播、激活函数等。
熟悉深度学习模型的训练和推理过程，包括数据准备、模型定义、训练循环和评估。

模型构建的三大要素：

Dataloader：负责数据加载和预处理，确保数据能够以合适的形式输入到模型中。
Network：定义神经网络的结构，包括各层的设置、前向传播过程等。
Loss：定义损失函数，用于衡量模型的预测结果与真实标签之间的差距，并指导模型的参数更新。

如果你正在选择reid这个课题。

我的建议这个课题目前能够继续做的东西不多(能发顶会的东西)，大约只有大模型这条路了。目前工业界该方向相对前三年也少了很多人。所以，如果你不得不选择该课题，最好延续大模型这条路做下去。这样你对大模型的知识了解会对后续发展有用。

代码结构总纲领:

分为Algorithm和GUI两个文件。Algorithm中的子文件每个都是单独功能的，充分解藕了的。比如,reid就包含detect/extract/search等子文件。GUI则是前端展示的交互和调度逻辑,也被充分解藕，比如，需要修改注册页面的交互在UiPageRegister.py中。
Algorithm 和 GUI之间也是充分解藕的。什么意思呢？Algorithm下面有个outer_api.py是整个算法所有的对外接口，GUI只能调动outer_api里的结构。如果你只想看算法流程不看GUI的话，只需要看看outer_api就行。

功能解释:

1. 注册界面

在这里插入图片描述

选择图片路径->确认按键->车辆检测-> 目标选择->输入注册标签->确认注册->调用reid提特征->注册的sql中(包括图像/特征/ID)
涉及代码: UiPageRegister.py

2. 管理数据界面

在这里插入图片描述

选择list行->调取sql->展示信息，支持修改ID和删除某个注册车辆
涉及代码: UiPageManager.py

3. 处理界面

在这里插入图片描述

选择图像或者视频某个文件: 只处理选择的文件
选择文件夹:文件夹下的所有图像或者视频都会被处理
三角播放按键：开始去处理选择的文件媒体,再点击就是暂停
四角重置按键: 点击重置流程
右上角工具按键: device[GPU只支持N卡需要直接配置好驱动和环境], sampleFt[处理视频时抽帧],Match Thresh[匹配时的阈值，两个特征之间的距离小于该阈值时为命中]
Note: 处理视频时, 并开启跟踪时, sampleFt最好设置为1, 因为track跟踪算法会参考位移变化, 抽帧多时,目标位移很大, 会跟踪不上。

自己简单DIY:

1. 前端界面换皮肤

第一种是直接修改GUI.ui下home.py中

self.Main_QF.setStyleSheet(u"QFrame#Main_QF{\n"
"background-color: rgb(129, 129, 129);\n"
"border:0px solid red;\n"
"border-radius:0px\n"
"}")

2. 前端界面模块组件修改

使用QT designer打开GUI.ui.home.ui,使用designer去修改,再 pyside6-uic home.ui > home.py
组件修改完,再修改对应的UiPagexxx.py中的交互流程。

3. 算法想上自己的模型

比如自己的Reid模型(建议把如pth等checkpoint这种模型转换成onnx或者tensorrt, 推理和训练是不一样的，训练时模型会保留梯度等信息且速度不如onnx这种推理架构)
修改reid_extract.py下的class ReIdExtract(object)就行，输入图像输出归一化的特征。
并且在Algorithm.libs.configs.model_cfgs配置文件把模型路径修改一下。