【干货】基于深度学习的目标检测算法——入门学习

最新推荐文章于 2024-06-19 13:56:00 发布

Nancyhan88

最新推荐文章于 2024-06-19 13:56:00 发布

阅读量664

点赞数 2

分类专栏：目标检测文章标签：目标检测

本文链接：https://blog.csdn.net/weixin_43981229/article/details/89476533

版权

目标检测专栏收录该内容

2 篇文章 0 订阅

订阅专栏

看了这么多有关目标检测的东西，想做一个输出，不停地看而不输出必然消化不了，谨以此写下这个博客。

背景

检测的主要目标是从静态图像或者视频序列中识别或者定位感兴趣的物体，它是计算机视觉领域的关键任务之一。视觉信息是人们接收外界信息的做主要的和高效率的形式。一直以来，人们致力于研究用计算机模拟人类对图像的认知，从而完成大量的工作，进而衍生出一门学科：计算机视觉。计算机视觉通过计算机模拟人类的大脑，从而自动识别出图像和视频所承载的有效信息。
目标检测技术应用的领域：
（1）军事领域，目标检测技术可广泛应用于雷达跟踪、制导弹以及遥感定位等各方面；
（2）医疗领域，通过观察人体外表特征或者X光片等医学图像，分析出患者可能患的疾病；
（3）交通领域，通过自动检测行人和道路在交通中的违规行为，减少人工交通管理成本……
当前目标检测技术主要面对的挑战：如何减小目标尺度和形变对检测的影响、如何提高目标定位的准确度以及如何减少背景干扰等问题。目标检测系统常用的评价指标是检测精度和速度，为了提高检测精度，目标检测系统需要能够有效排除背景、光照、噪声等因素的干扰；为了提高检测的速度，实现实时目标检测，目标检测系统需要能够精简检测流程，简化图像处理的算法。
【基于卷积神经网络的目标检测算法】
基于卷积神经网络的目标检测算法大致分为两类，一类是基于目标候选框的目标检测，另一类是基于回归思想的目标检测。
基于目标候选框的目标检测：
R-CNN：首先使用选择性搜索模型生成目标候选框，再使用卷积神经网络从目标候选框中提取特征，然后使用提取的特征为每一类目标训练一个分类器。R-CNN使用支持向量机对目标进行分类。缺点：只在特征提取极端使用CNN，其候选框生成和分类阶段均采用传统方法，导致R-CNN训练繁琐且严重影响训练和测试速度，并且特征的存取需要耗费大量空间，同时R-CNN中卷积神经网络需要输入图像保持固定大小，在一定程度上所示了检测精度。
SPPnet: Sppnet中空间金字塔池化的方法解决了卷积神经网络限制输入尺寸的问题，使得卷积神经网络中的输入图像无需经过裁剪、缩放等操作，在一定程度上提高了检测精度，并且对弈一幅图像SPPnet只需提取一遍特征，明显提升目标检测的速度。
Fast R-CNN: 将R-CNN中的SVM分类器替换成了卷积神经网络中的Softmax分类器，并适用CNN对目标候选框进行回归定位得到最终检测结果，使得目标检测的流程进一步优化，检测速度进一步提高。
Faster R-CNN: 将R-CNN中分离的步骤全部统一于CNN中，提出了区域候选网络（RPN），取代了耗时巨大的选择性搜索算法。
基于回归思想的目标检测：
YOLO：以整张图像作为网络的输入，直接在输出层回归出目标边框的位置和所属的类别。YOLO虽然很大程度上提升了目标检测的速度，但是在精度上明显低于基于候选框的目标检测算法，尤其是对于小目标的检测精度较低。分为以下几步：
（1）将输入图像分割成SxS个网格，如果目标的中心落入某一个网格中，则由这个网格负责检测该目标；
（2）每一个网格预测B个边框以及他们的置信值，置信值反映的是边框中包含目标的可能性大小以及该预测的准确性信息。置信值被定义为。
如果网格中没有目标，那么Pr(Object)为0,其置信值也相应为0，否则Pr(Object)为1，其置信值为预测边框与真实边框的IOU值。
（3）对于每个一个边框，YOLO将会生成五个预测值：x,y,w,h和置信值confidence。其中（x,y）表示预测边框的中心坐标，w和h分别表示预测边框的宽和高。最终的confidence值表示预测框和真实框（ground truth）之间的Iou值。
（4）每一个网格会预测C个条件概率，分别表示属于某个类别的可能性，用Pr(Classi|Objiect)表示。无论每个网络预测几个边框，对于一个网格只生成一组概率值。换句话说，同一网格预测的B个边框共享这个类别条件概率。如此一来，在预测边框时只需将置信值和类别条件概率相乘，就能够得到各类别的置信概率。YOLO的输出是一个SxSx（B*5+C）的张量，从而确定了网络输出的维度。最后YOLO模型采用非最大化已知算法得到最终的目标检测结果。
SSD：将Faster R-CNN中锚机制和YOLO中的回归思想有效结合没使用了多尺度的区域特征进行回归，在实现实时目标检测的同时能够获得较高的检测精度。
以上只是对目标检测思想的概括性表达啦，刚刚开始写，写的不好，多多见谅啦~~~~