利用GoogleColab进行YOLO行人检测计数（YOLOv3+DeepSORT）

最新推荐文章于 2024-06-20 08:43:29 发布

KK LUO

最新推荐文章于 2024-06-20 08:43:29 发布

阅读量6.5k

点赞数 16

分类专栏：深度学习文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_39569364/article/details/106743158

版权

深度学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

行人检测计数YOLOv3+DeepSORT——检测+多目标跟踪

系统设计：
行人检测系统流程——YOLOv3+DeepSORT
- 几个问题及解决
工程实现：
薅免费GPU——GoogleColab真香
多目标跟踪算法有自己的训练数据集MOT,它和每一帧的目标数及轨迹相关。
- 项目工程仅供参考

这是我毕业设计总结吧，本课题的研究目标是应用于无人机自动检测分析场景下的行人目标检测算法，基于飞行中的无人机反馈图像进行目标检测并计数。

系统设计：

行人检测系统流程——YOLOv3+DeepSORT

利用YOLO算法进行行人目标检测是逐帧进行检测的，且相互独立，因此就有个问题，视频中不同时刻的同一个人，位置发生了变化，如何关联上？因此采用了YOLOv3检测+DeepSORT多目标跟踪算法结合的方式作为系统架构。如下图所示如何判断Ti-1帧中的红框目标A和Ti帧的红框目标a是同一个目标不重复计数。
在这里插入图片描述
行人检测系统算法流程如下：
通过YOLOv3检测器获取目标检测的结果：检测框坐标bounding boxes、特征feature map、置信度的信息数据生成Detections类，然后利用卡尔曼滤波根据单个Detection生成的均值、方差、id预测目标的下一个位置的跟踪框Tracks再使用匈牙利算法将预测后的Tracks和当前帧中的Detecions进行匹配然后根据匹配结果更新卡尔曼滤波的预测数据。如果跟踪框Tracks与Detection的马氏距离在阈值内则两个ID关联，如果新获得的目标对象Detection无匹配的跟踪框Track则产生新的Tracks。因此设计了预测框Tracks有三种状态：尝试态Tentative、确定态Confirmed、删除态Deleted。未与检测框匹配的为尝试态，和检测框匹配的为确定态，无检测框匹配的为删除态。
在这里插入图片描述
计数的数值结果为确定态预测框的数值，系统流程如下所示：

在这里插入图片描述
如下图所示，可以看到每个目标有两个框，蓝色的框是YOLO检测器的检测结果，白色框是卡尔曼滤波基于上一帧预测的结果，根据两个框的IOU判断目标的ID是不是变化。如图垃圾桶被检测到，但是没有预测框进行匹配，没有赋予ID。
在这里插入图片描述

几个问题及解决

由于透视投影的成像原理，3D物体俯视和平视的图像差别很大，如图所示，同一目标视角不同下的图像特征对比 ，这是客观存在的问题而且涉及图像特征的学习，因此常见的通用数据集COCO/PascalVOC基于水平视角拍摄的图像数据训练出来的模型并不能很好的应对空中视角的行人检测，需要自己制作数据集进行训练。

我利用自己制作的数据集训练的权重和官方的权重测试的效果对比如下，可以看出来改善明显。
计数采用多目标跟踪算法 DeepSORT ；

工程实现：

薅免费GPU——GoogleColab真香

由于2020疫情突发，学校封校断电服务器没办法用，时间还一直在流，总是要提交毕业设计的。本来想花钱租云服务器的突然发现了大宝贝GoogleColab，免费的GPU，最重要的是和googleDrive直接连接以及它的开发工具真的很好用，十分方便。而且对于训练yolo来说已经够用了，虽然Google对于GPU的用量有限制，而且我用超了被限制了。还是对其好评，工具对于开发者来说十分友好♥**！**
🔗如何使用GoogleColab训练YOLO没用过的朋友可以看一下这个详细教程，真的很好用的工具。
在这里插入图片描述 GPU的分配会根据你的使用分配，一般刚开始使用会分配性能较好的GPU，我被限制后只剩K80了

DeepSORT搭建

在google云盘创建一个项目文件夹，在项目文件夹种创建一个googleColab的.ipynb文件命名为DeepSORT.（如果你首次使用右键么找到，可以在关联更多应用里找到这个图标添加应用到你的Chrome）
修改你的文件路径，运行命令

#连接Google云硬盘
from google.colab import drive
drive.mount(’/content/drive/’)
#进入项目文件夹
%cd /content/drive/My\ Drive/YOLO_DeepSort

连接到google云盘在这里插入图片描述
3. 拉取工程

#拉取工程
!git clone https://github.com/Qidian213/deep_sort_yolov3

由于DeepSORT使用keras我用需要把yolo的权重文件格式.weight转换为.h5,运行deep_sort_yolov3/keras-yolo3文件夹内的convert.py文件。注：如果你检测的类有变需要修改一下convert.py文件，例如我训练yolo只检测一类person。

#把权重文件转换格式
%cd deep_sort_yolov3/keras-yolo3
!python convert.py yolov4.cfg /content/drive/My\ Drive/YOLO_DeepSort/yolov4.weights /content/drive/My\ Drive/YOLO_DeepSort/yolov4.h5

在项目文件夹deep_sort_yolov3中修改文件demo.py的1.视频读取路径 cv2.VideoCapture("XXX.mp4")由于没有图像界面需要注释掉imshow显示结果2.注释imshow————#cv2.imshow('', frame)

在这里插入图片描述
然后运行demo.py后可以查看运行结果output.avi，由于cloab默认运行tensorflow2.0因此需要强调tensorflow版本%tensorflow_version 1.x

结果展示

【毕业设计】无人机行人目标检测YOLOv3+DeepSORT

关于计数

我在每帧检测的时候添加了一个person_num的变量，根据预测框返回的状态进行计数。注：这个计数只是计算当前帧的人数，全过程的人数计算还没完成，需要根据预测框ID的变化进行计算。在这里插入图片描述

关于数据集制作

利用无人机航拍，抽取关键帧后利用标注工具labelImg进行标注

关键帧提取脚本:微云orGoogleDrive

在这里插入图片描述

关于YOLOv3模型训练

多目标跟踪算法有自己的训练数据集MOT,它和每一帧的目标数及轨迹相关。

**这个系统我仅仅训练了YOLO检测器没有对DeepSORT多目标跟踪器进行训练**
------可以替换检测器YOLOv3为SSD或者YOLOv4-----------

在GoogleDrive上创建一个YOLOv3的项目文件夹，拉取YOLOv3的项目工程，将自己的数据集上传到GoogleDrive。训练YOLO的详细教程参考：
1.谷歌Colab训练自己YOLOv3数据集
 2.YOLO从零开始：基于YOLOv3的行人检测入门指南
注：GoogleColab训练过程中因网络等不可抗因素断开可以根据日志恢复训练

./darknet detector train cfg/voc.data cfg/yolov3-voc.cfg backup/yolov3-voc.backup -gpus 0,1 | tee -a train7.log

项目工程仅供参考

微云:包括数据集等
GoogleDrive：YOLO_DeepSORT and YOLOv3

KK LUO

关注

16
点赞
踩
115

收藏

觉得还不错? 一键收藏
4
评论
利用GoogleColab进行YOLO行人检测计数（YOLOv3+DeepSORT）

行人检测计数YOLOv3+DeepSORT——检测+多目标跟踪系统设计：行人检测系统流程——YOLOv3+DeepSORT几个问题及解决工程实现：薅免费GPU——GoogleColab真香DeepSORT搭建结果展示关于计数关于数据集制作关于YOLOv3模型训练多目标跟踪算法有自己的训练数据集MOT,它和每一帧的目标数及轨迹相关。先说一下我问什么来学Go语言，（python确实好用）。为了进入区块链开发，搜索招聘信息的时候发现大部分区块链工程师都要求精通Golang。系统设计：本课题的研究目标是应用
复制链接

扫一扫

专栏目录