7.目标检测_目标检测任务中能不能输出目标物体的方位信息-CSDN博客

本文链接：https://blog.csdn.net/weixin_50973728/article/details/125341643

目标检测算法分类

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

对于目标检测来说不仅仅是分类这样简单的一个图片输出一个结果，而且还需要输出图片中目标的位置信息，所以从分类到检测，如下图标记了过程

在这里插入图片描述

**在分类的时候我们直接输出各个类别的概率，如果加上定位的话，我们可以考虑在 网络的最后输出加上位置信息。（增加一段全连接输出4个位置，做损失计算）**

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

这种方法类似一种暴力穷举的方法，会消耗大量的计算力量，并且由于窗口大小问题可能会造成效果不佳，但是提供了一种解决目标检测问题的思路。

在这里插入图片描述

在这里插入图片描述
平均精确率（mean average precision）

流程总结
输入图片

找出图片中可能存在目标的候选区域region proposal

将候选区域调整为适应AlexNet网络的输入图像的大小227227，通过CNN对候选区域提取特征向量，2000个建议框的CNN特征组合成网络AlexNet最终输出：20004096维矩阵

将20004096维特征经过SVM分类器（20种分类，SVM是二分类器，则有20个SVM），获得200020种类别矩阵。
分别对200020维矩阵中进行非极大值抑制（NMS:non-maximum suppression）提出重叠建议框，得到与目标物体最高的一些建议框

修正bbox，对bbox做回归微调
优缺点