目标检测之OHEM

最新推荐文章于 2021-10-09 17:08:55 发布

thisiszdy

最新推荐文章于 2021-10-09 17:08:55 发布

阅读量895

点赞数

分类专栏：目标检测

本文链接：https://blog.csdn.net/thisiszdy/article/details/89950030

版权

23 篇文章 3 订阅

订阅专栏

Training Region-based Object Detectors with Online Hard Example Mining

在这里插入图片描述
步骤：

将Fast R-CNN分成两个部分：ConvNet和RoINet.；ConvNet为共享的底层卷积层，生成feature map；RoINet为RoI Pooling后的层，包括全连接层；
对于每张输入图像，经前向传播，用ConvNet获得feature maps（这里为RoI Pooling层的输入）；
将事先计算好的proposals，经RoI Pooling层投影到feature maps上，获取固定的特征输出作为全连接层的输入；需要注意的是，论文说，为了减少显存以及后向传播的时间，这里的RoINet是有两个的，它们共享权重，RoINet1是只读（只进行forward），如上图(a)；RoINet2进行forward和backward，如上图(b)：
（1）将原图的所有props扔到RoINet1，计算它们的loss（这里有两个loss：cls和reg）；
（2）根据loss从高到低排序，以及利用NMS，来选出前K个props（K由论文里的N和B参数决定） !!!为什么要用NMS? ___显然对于那些高度overlap的props经RoI的投影后，其在feature maps上的位置和大小是差不多一样的，容易导致loss double counting问题；
（3）将选出的K个props（可以理解成hard examples）扔到RoINet2，这时的RoINet2和Fast RCNN的RoINet一样，计算K个props的loss，并回传梯度/残差给ConvNet，来更新整个网络；

OHME优势：

结果
在这里插入图片描述

在这里插入图片描述

关注

专栏目录