目标检测模型总结

最新推荐文章于 2024-06-10 12:10:07 发布

Jager_416

最新推荐文章于 2024-06-10 12:10:07 发布

阅读量1.7k

点赞数 3

文章标签：目标检测计算机视觉深度学习

本文链接：https://blog.csdn.net/Lc_001/article/details/129435559

版权

在这里插入图片描述

1 问题概况

1.1 定义

目标检测的任务是对画面中的目标进行定位和分类。定位是指回归目标的矩形框，分类是指对目标框进行类别区分。

1.2 主要问题

目标检测任务主要解决以下几个问题：目标的种类和数量、目标的尺寸、外界的干扰因素、特定场景任务等；

2 方法概况

目标检测算法可以分为传统目标检测算法和基于深度学习的目标检测算法。其中传统的目标检测算法的主要工作集中在手工设计中低层面的特征提取算法，如SIFT、HOG特征等；基于深度学习的目标检测算法的主要功能是通过网络的设计，结合数据和loss的使用，使特征提取这个工作智能化，并将整个目标检测任务简单化。近些年随着计算领域的突破和深度学习算法架构的突破，基于深度学习的算法性能大大优于传统的方法，传统的算法已经渐渐退出历史舞台了。不过很多深度学习的方法也是基于传统算法的思路去做实现的，接下来文章会给大家介绍传统算法和深度学习算法的发展过程，让大家对目标检测算法有个大致的概念。

2.1 传统目标检测算法

传统目标检测算法流程示意图如下所示：
在这里插入图片描述

候选框提取：通过滑动窗口算法、SS算法等选取目标候选框；
特征提取：手工设计算法提取特征，如VJ、HOG特征等算法，传统方法的主要工作都集中在底层和中层特征提取的算法设计上；
分类器：通过SVM等算法对每一个候选框进行分类；
NMS非极大值抑制：

将所有的候选框使用分类器按类别划分，并剔除背景类，因为背景类无需NMS；
对每个物体类中的边界框(B_BOX)，按照分类置信度降序排列；
在某一类中，选择置信度最高的边界框B_BOX1，将B_BOX1从输入列表中去除，并加入输出列表；
逐个计算B_BOX1与其余B_BOX2的交并比IoU，若IoU(B_BOX1,B_BOX2) > 阈值TH，则在输入去除B_BOX2；
重复上述3、4两个步骤，直到输入列表为空，完成一个物体类的遍历；
重复上述1、2、3、4四个步骤，直到所有物体类的NMS处理完成；

2.2 基于深度学习的目标检测算法

目前基于深度学习的目标算法技术方向可以分为基于anchor base和基于anchor free的方法。anchor base和anchor free 的区别在于，有没有使用anchor来提取候选框。目标检测领域的发展从anchor free到anchor base，现在又有回到anchor-free的趋势，学术界技术的迭代更新也引导着工业界的变革。其中基于anchor base的技术路线中又可以分为two-stage和one-stage的方法。