基于Yolo3_deep_sort的目标追踪(原理及部分代码说明) --- 已解决

最新推荐文章于 2024-07-09 10:57:56 发布

置顶

喵喵love

最新推荐文章于 2024-07-09 10:57:56 发布

阅读量3.6k

点赞数 12

分类专栏：目标追踪文章标签：深度学习

本文链接：https://blog.csdn.net/qq_41603193/article/details/106306391

版权

基于Yolo3_Deep_sort的多目标追踪算法原理及部分代码说明

写在前面的话：楼主前一段时间参与了一个小项目，是关于人的目标追踪，在此记录一下，这篇博文主要是记录一下对这个方法的认识和理解，希望能引起你的共鸣。如果想看具体的测试环境搭建及复现说明，请查看我的另一篇博客，传送门。

将Yolo3与Deep_sort相结合，相当于目标检测中的Two stages的结构，采用detection（Yolo3）+ track（Deep_sort）的方式实现目标追踪。

1、Yolo算法思想

Yolo（You Only Look Once，Yolo）在本方法中负责detection部分，其将输入图像分成S×S个格子，若某个物体 Ground truth 的中心位置的坐标落入到某个格子，那么这个格子就负责检测出这个物体，如图1所示。
图1 检测过程示意图

图1 检测过程示意图每个格子预测B个bounding box及其置信度(confidence score)，以及C个类别概率。bbox信息(x,y,w,h)为物体的中心位置相对格子位置的偏移及宽度和高度，其均被归一化处理。置信度表示的是：是否包含物体以及包含物体情况下位置的准确性，定义为： $$ Pr(Object)\times IOU^{truth}_{pred} $$ 其中：$Pr(Object)\in \left ( 0,1 \right )$,期望预测的置信度与Ground truth的IOU相同，在测试时，每个box通过类别概率和box置信度相乘来得到特定类别置信度： $$ Pr(Class_{i}|Object)*Pr(Object)*IOU^{truth}_{pred}=Pr(Class_{i})\times IOU^{truth}_{pred} $$

(1) Yolo1采用卷积神经网络结构

开始的卷积层提取图像特征，全连接层预测输出概率。借鉴了GoogLeNet分类网络结构，共有24个卷积层，2个全链接层，网络在最后使用全连接层进行类别输出。
损失函数：使用了均方和误差作为loss函数：
$loss=\sum_{i=0}^{s^{2}}coordErr+iouErr+clsErr$
其由三部分组成：坐标误差、IOU误差和分类误差。

(2) Yolo2相对Yolo1进行了改进

首先去掉了在定位层后的dropout层，并在卷积层中全部使用BN层进行批量归一化处理。借鉴Faster R-CNN的思想预测bbox的偏移，移除了全连接层，使用box替换grid预测一个类别。
而后，对Faster R-CNN的首选先验框方法做了改进，采样k-means在训练集bbox上进行聚类产生合适的先验框，由于使用欧氏距离会使较大的bbox比较小的bbox产生更大的误差，而IOU与bbox尺寸无关，因此使用IOU参与距离计算，使得通过这些anchor boxes获得好的IOU分值。距离公式：
$D (b o x, c e n t r o i d) = 1 - I O U (b o x, c e$

最低0.47元/天解锁文章

喵喵love

关注

12
点赞
踩
60

收藏

觉得还不错? 一键收藏
1
评论
基于Yolo3_deep_sort的目标追踪(原理及部分代码说明) --- 已解决

基于Yolo3_Deep_sort的多目标追踪算法原理及部分代码说明写在前面的话：楼主前一段时间参与了一个小项目，是关于人的目标追踪，在此记录一下，代码及代码介绍见我另一篇博客，这一篇主要是记录一下对这个方法的认识和理解，希望能引起你的共鸣。将Yolo3与Deep_sort相结合，相当于目标检测中的Two stages的结构，采用detection（Yolo3）+ track（Deep_sort）的方式实现目标追踪。1、Yolo算法思想 Yolo（You Only Look Once，Yo
复制链接

扫一扫