前奏 | 传统目标检测算法思路

最新推荐文章于 2024-07-01 10:55:41 发布

edward_zcl

最新推荐文章于 2024-07-01 10:55:41 发布

阅读量842

点赞数 1

分类专栏：人工智能-神经网络机器学习入门必备 Python使用技巧文章标签： pytorch 深度学习人工智能

原文链接：https://blog.csdn.net/x454045816/article/details/105852651

版权

人工智能-神经网络同时被 3 个专栏收录

175 篇文章 25 订阅

订阅专栏

Python使用技巧

151 篇文章 19 订阅

订阅专栏

机器学习入门必备

119 篇文章 10 订阅

订阅专栏

本文介绍了目标检测的基本概念和传统方法，包括滑动窗口和机器学习算法的应用，指出了其计算量大、速度慢和准确性不足的问题。随着卷积神经网络（CNN）的引入，虽然准确率有所提升，但速度并未显著加快。文章强调了理解传统方法对于后续深入学习深度学习目标检测算法的重要性，并预告了后续将探讨如何提高检测速度。

摘要由CSDN通过智能技术生成

上期我们一起学了CNN中四种常用的卷积操作，如下链接：
CNN中常用的四种卷积详解

从这期开始，我们开始步入目标检测领域的大门，开始逐步一层一层的揭开目标检测的面纱。路要一步一步的走，字得一个一个的码。步子不能跨太大，太大容易那个啥，字也不能码太多，太多也不好消化。

目标检测是计算机视觉和数字图像处理的一个热门方向，广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域，通过计算机视觉减少对人力资本的消耗，具有重要的现实意义。

因此，目标检测也就成为了近年来理论和应用的研究热点，它是图像处理和计算机视觉学科的重要分支，也是智能监控系统的核心部分，同时目标检测也是泛身份识别领域的一个基础性的算法，对后续的人脸识别、步态识别、人群计数、实例分割等任务起着至关重要的作用。

由于深度学习的广泛运用，目标检测算法得到了较为快速的发展，所以接下来的一段时间我们将和大家一起一步一步的深入了解目标检测算法的原理和应用。在学习深度学习方面的目标检测之前，先了解下传统的目标检测的思路，这有助于我们后面对深度学习目标检测算法的理解。

传统目标检测方法

目标检测就是找出图像中所感兴趣的物体，包括物体定位和物体分类两个子任务，即不仅需要对物体进行分类，还要检测出物体的位置。通常分为单目标检测和多目标检测，如下图：

上面的检测通常分三步走：

选取感兴趣区域，这一步用来选取可能包含物体的区域；
对可能包含物体的区域进行特征提取；
对提取的特征进行检测分类。

滑动窗口+传统机器学习算法

传统的目标检测算法通常用滑动窗口的方式，即一个窗口，在检测图片上滑动进行依次选取感兴趣区域，如下图：

分别对滑动的每个窗口进行特征提取，比如SIFT,HOG等特征提取算法进行提取特征，之后对提取的特征利用机器学习算法，比如支持向量机等进行分类，最终得到该窗口是否包含某一类物体。如下图：

但是，我们知道，图片中的物体有大有小，尺度不同，所以用一个固定的窗口进行滑动，当物体较小的时候，会出现该窗口可能会框住很多的背景；而当物体较大的时候，会出现框住物体的局部，进而对该框的物体进行提取特征，进行分类的时候可能会产生误分类，或者出现多个正确识别的结果。
所以，在设计窗口大小的时候，得设计各种尺寸的窗口，这样就会产生大量的计算，导致运行速度慢。

总的来说，传统的目标检测算法有以下三个缺点：