目标检测学习笔记

本文深入探讨目标检测中的先验框(锚框)概念,包括下采样、特征图、先验框类别信息的确定以及生成。讲解了下采样的原理,特征图的作用,以及如何通过IoU阈值来划分先验框类别。此外,介绍了简化版SSD模型——Tiny_Detector的结构,包含分类头和回归头的功能,以及边界框的编码与解码方法。
摘要由CSDN通过智能技术生成

本篇续上一篇,继续学习目标检测相关知识。笔记仅为巩固个人学习效果、督促自我进步用,若有读者发现不正确的地方请不吝指教。

3. 先验框

先验框,又称锚框,是目标检测过程中用到一个重要概念。按第1.4节中所描述,目标检测需要通过滑窗不断在图像上移动,对图像中的每个区域进行分类打分,那么这个滑窗就是先验框。
显然,先验框有不同的尺度,包括大小、长宽比。
为了覆盖更多可能的情况,在图中的同一个位置,会设置几个不同尺度的先验框。但这样带来的问题是,如果在原图中每个像素都设置多个先验框,先验框的数量就太多了。为了应对这种情况,一般会先对原图进行下采样。

3.1 下采样

下采样原理:对于一幅图像 I I I,尺寸为 M × N M\times N M×N,对其进行s倍下采样,即得到 ( M / s ) × ( N / s ) (M/s)\times(N/s) (M/s)×(N/s)尺寸的分辨率图像,其中s是M和N的公约数。如果考虑的是矩阵形式的图像,就是把原始图像 s × s s\times s s×s窗口内的图像变成一个像素,这个像素点的值是窗口内所有像素的均值:
p k = ∑ i ∈ w i n ( k ) I i / S 2 p_k={\sum_{i\in win(k)}I_i/S^2} pk=iwin(k)Ii/S2

3.2 特征图

原图经下采样之后得到的称为特征图。目标检测先验框通过在特征图上进行遍历,这样大大减小了先验框的数量,同时也能覆盖大多数情况。
VOC数据集图片像素: 224 × 224 × 3 224\times224\times3 224×224×3,经5次下采样后,可得到

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值