SSD物体识别-论文笔记

最新推荐文章于 2022-04-26 17:07:28 发布

AI强仔

最新推荐文章于 2022-04-26 17:07:28 发布

阅读量272

点赞数 1

分类专栏：物体识别图像处理人工智能

人工智能同时被 3 个专栏收录

150 篇文章 20 订阅

订阅专栏

35 篇文章 5 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

1 简介

本文根据2016年《SSD: Single Shot MultiBox Detector》翻译总结。
SSD比YOLO更快、更准确；准确率也可以达到faster R-CNN的水平。

2 SSD

2.1 模型

在这里插入图片描述

多尺度特征：如上图一堆extra feature layer层，他们的大小逐步减小，支持多尺度预测。
卷积预测：使用卷积滤波，上面的每个特征层可以生成一个固定检测预测的集合。Bounding box offset output 是相对于一个默认的box 位置衡量的。
默认boxes、纵横比：对于每个特征map cell，有默认的bounding box。如下图，针对不同的特征图（下图有两个88，44），在每个位置产生4个不同纵横比的默认box。

2.2 训练

匹配策略：训练时需要决定哪一个默认box与ground truth detection对应。采用的是best jaccard overlap。
损失函数：结合localization和confidence。公式较多，如下：
选择默认boxes的尺度和纵横比
Hard negative mining：在训练匹配时，会发现大量默认box是negative的，故选择得分高的，最后negative和positive比例不超过3：1.

3 实验结果

可以看到SSD效果好于faster R-CNN。大的输入和更多的数据有利于结果。
在这里插入图片描述

从下图也可以看出来，SSD对物体大小敏感的（下面左图），更容易识别大的物体；对纵横比不敏感（下面右图），或者说较健壮，因为已使用了不同纵横比的box。
在这里插入图片描述

3.1 模型分析

在这里插入图片描述

从上表可以看出来，数据增强、更多的默认box可以提高mAP。使用atrous可以提高速度20%。Atrous 卷积，就是带洞的卷积，带洞卷积的有效性基于一个假设：紧密相邻的像素几乎相同，全部纳入属于冗余，不如跳H(hole size)个取一个。带洞卷积减少了核的大小（减少了参数的数量），可以达到节省内存的作用。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。