【3】目标检测之SSD-Single Shot MultiBox Detector

最新推荐文章于 2022-04-26 17:07:28 发布

mohoooooo

最新推荐文章于 2022-04-26 17:07:28 发布

阅读量135

点赞数

分类专栏：目标检测深度学习文章标签：深度学习

本文链接：https://blog.csdn.net/qq_16009377/article/details/124281674

版权

深度学习同时被 2 个专栏收录

13 篇文章 1 订阅

订阅专栏

目标检测

9 篇文章 0 订阅

订阅专栏

这里写目录标题

网络结构
知识点
- DefaultBox
- Predictor
损失函数
- 类别损失
- 定位损失
训练方法

网络结构

骨干网络采用VGG-16模型，将经过卷积得到的特征层中的Conv4_3, Conv7, Conv8_2, Conv9_2, Conv10_2, Conv11_2这一共6个特征层作为预测层，分别通过Predictor进行卷积获得8732个default box的category score和shape offset to default box coordinates,将预测结果经过筛选和非极大值抑制NMS得到最终预测结果。

在这里插入图片描述

知识点

DefaultBox

SSD网络会对不同的特征图层进行不同尺寸的DefaultBox的预测
在这里插入图片描述

Predictor

Predictor由两个部分组成，分别是Detector和Classifier，Detector输出defaultbox的坐标偏移，Classifier输出各类别得分（包括背景），Predictor用卷积实现，通道数为Num of DefaultBox * (Num of Classes+ 4)
在这里插入图片描述

损失函数

类别损失

在这里插入图片描述

定位损失

在这里插入图片描述

训练方法

在目标检测任务中，通常会生成大量的先验框，网络对于所有的先验框会生成对应的坐标偏移，那么网络在计算定位误差的时候，必须要知道每个先验框所对应的真实框。

匹配条件1，对于每个真实框，找到与之IOU最大的先验框，保证每个真实框都有一个先验框来负责检测它。正常来说，网络生成的先验框的数量是远远大于真实框的数量的，如果只根据策略1来进行匹配，大量的未与真实框相匹配的先验框，它们的标签都为背景，那么这将导致类别严重失衡。
这个时候，还需要第2个条件，对于剩余的未被匹配的先验框，如果有某个真实框与它的IOU大于某个阈值(一般取0.5)，也将该真实框与之匹配。正常情况下，每个真实框都会同时与多个先验框进行匹配，而每个先验框只能匹配一个真实框。匹配过程需先满足第一个条件，然后满足第二个条件。

即便每个真实框可与多个先验框同时匹配，但背景先验框的数量还是要明显大于物体先验框的数量。因此，论文中还使用了Hard negative mining的策略，按照先验框的类别置信度误差从高到低排序，只选择前top_k个先验框作为训练的背景先验框（背景先验框的采样），最终正负样本的比例约为1:3。

mohoooooo

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【3】目标检测之SSD-Single Shot MultiBox Detector

这里写目录标题网络结构知识点DefaultBoxPredictor损失函数类别损失定位损失训练方法网络结构骨干网络采用VGG-16模型，将经过卷积得到的特征层中的Conv4_3, Conv7, Conv8_2, Conv9_2, Conv10_2, Conv11_2这一共6个特征层作为预测层，分别通过Predictor进行卷积获得8732个default box的category score和shape offset to default box coordinates,将预测结果经过筛选和非极大值抑制
复制链接

扫一扫

专栏目录