目标检测学习笔记

最新推荐文章于 2024-07-11 23:56:34 发布

星辰大海_2020

最新推荐文章于 2024-07-11 23:56:34 发布

阅读量1.6k

点赞数

文章标签：计算机视觉 pytorch

本文链接：https://blog.csdn.net/weixin_41870056/article/details/111400306

版权

本文深入探讨目标检测中的先验框（锚框）概念，包括下采样、特征图、先验框类别信息的确定以及生成。讲解了下采样的原理，特征图的作用，以及如何通过IoU阈值来划分先验框类别。此外，介绍了简化版SSD模型——Tiny_Detector的结构，包含分类头和回归头的功能，以及边界框的编码与解码方法。

摘要由CSDN通过智能技术生成

本篇续上一篇，继续学习目标检测相关知识。笔记仅为巩固个人学习效果、督促自我进步用，若有读者发现不正确的地方请不吝指教。

3. 先验框

先验框，又称锚框，是目标检测过程中用到一个重要概念。按第1.4节中所描述，目标检测需要通过滑窗不断在图像上移动，对图像中的每个区域进行分类打分，那么这个滑窗就是先验框。
显然，先验框有不同的尺度，包括大小、长宽比。
为了覆盖更多可能的情况，在图中的同一个位置，会设置几个不同尺度的先验框。但这样带来的问题是，如果在原图中每个像素都设置多个先验框，先验框的数量就太多了。为了应对这种情况，一般会先对原图进行下采样。

3.1 下采样

下采样原理：对于一幅图像 $I$ ，尺寸为 $M\times N$ ，对其进行s倍下采样，即得到 $(M/s)\times(N/s)$ 尺寸的分辨率图像，其中s是M和N的公约数。如果考虑的是矩阵形式的图像，就是把原始图像 $s\times s$ 窗口内的图像变成一个像素，这个像素点的值是窗口内所有像素的均值：
$p_k={\sum_{i\in win(k)}I_i/S^2}$

3.2 特征图

原图经下采样之后得到的称为特征图。目标检测先验框通过在特征图上进行遍历，这样大大减小了先验框的数量，同时也能覆盖大多数情况。
VOC数据集图片像素： $224\times224\times3$ ，经5次下采样后，可得到

最低0.47元/天解锁文章

星辰大海_2020

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
目标检测学习笔记

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码
复制链接

扫一扫