1 SSD
最后一层由多个尺度的特征图一起组成的
然而他最后一层的多尺度是有限的,对于极小的目标识别,SSD就无能为力了。
2 FPN
特征金字塔网络,不是一味的下采样去提取语义信息来识别物体,而是从顶层的每一层都进行上采样来获取准确的像素位置信息(类似残差网络的挑层连接)
因为卷积操作可以高效的提取语义信息,但是存在像素错位的问题,这种上采样还原特征图的方式很好的缓解了像素不准的问题。但是这样带来了计算量的增多。
3 SNIPER
在每个尺度下都有一个重点关注区域,框中区域的目标都在最佳尺度。
还加入了重点排除区域,在许多背景中,许多目标是无需识别的。
scale variation带来的问题新的解决方法
之前的刚发主要是两种
一种是将图像进行不同尺度的缩放,然后送
目标检测中的多尺度问题
最新推荐文章于 2024-08-01 04:10:44 发布