CornerNet(MS COCO,Object Detection)
Abstract
- 使用单纯的卷积网络检测成对的关键点来预测目标框。关键点预测使得一阶段检测模型中不再需要anchor box。
- 提出corner pooling
Introduction
anchor机制的缺点:
- 需要大量的anchors,但是只有一小部分有用,正样本和负样本极度不平衡,而且减慢训练速度
- anchors机制需要大量的超参数,且anchor 的大小比例有很多种选择。考虑到多尺度情况下的预测,网络将需要多尺度的特征和多尺度的anchors
corner net 使用卷积神经网络生成所有实例的左上关键点的热图,以及右下关键点的热图,和每个关键点的embedding 向量。embedding 向量负责将同一个目标的两个关键点分为一类
corner pooling:包含两个特征图。 在每个像素点处,对 从第一个特征图上该点处的特征向量到右侧的所有特征向量做最大池化,对 从第二个特征映图在该点处的特征向量下面的所有特征向量做最大池化,然后将两个池化结果相加
[外链图片转存失败(img-yGCGk6CZ-1567866078543)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1561360144591.png)]
network
输出:两个热图(h *w *c, c是预测类别数目),嵌入向量,偏移(优化目标框位置)
backbone : 基于沙漏网络 hourglass network
沙漏网络之后是两个预测模块。 一个模块用于左上角,而另一个模块用于右下角。 每个模块都有自己的corner pooling模块,在预测热图、嵌入和偏移之前,池化来自沙漏网络的特征
使用嵌入向量之间的距离来预测两个关键点是否属于同一类
[外链图片转存失败(img-Laocxh2v-1567866078550)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1561087848965.png)]