CornerNet-Lite(COCO,Object Detection)
Abstract
- 基于关键点的检测方法比一阶段模型进度更高,但是付出了时间代价。
- 本文提出实时的cornerNet模型,cornerNet-Lite 模型,包含两个cornerNet的变种:
- CornerNet-Saccade(相比cornernet速度提升6x,(速度仍然不够实时),AP 提升1.0%)离线检测
- CornerNet-Squeeze(相比YOLOV3AP提升1.4%,速度34ms,YOLOV3 39ms)实时检测
Introduction
- 基于关键点的检测方法中,cornerNet性能最优(2019.4),同时在COCO上的性能超越了一阶段方法
- corner net的主要缺点是推理速度太慢,1.147s 每张。降低分辨率速度可达42ms 接近YOLOV3,但是AP下降严重
提升速度的两种思路:1. 减少像素点 2.减少每个像素点上的操作
两种思路分别对应两个模型:CornerNet-Saccade 和 CornerNet-Squeeze
但是两种模型的结合并不能得到更好的结果
CornerNet-Saccade
[外链图片转存失败(img-IOEePKAN-1567866105042)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1561100136044.png)]
使用缩小的完整图像作为沙漏网络的输入,得到attention maps上的可能存在目标的地方,和粗略的目标框。然后只对这些目标框做检测,其他区域不考虑,因此减少了计算量
- 首先缩小原图到255和192(长边),192padding到255,方便后面并行处理
- 输入沙漏网络得到的不同尺度的特征图(3个),通过conv(3*3,ReLU) + conv(1 * 1,sigmod)得到 3个attention maps,分别对应小(32)中(32-96)大(96)目标
- 在attention maps上得到的候选目标框需要在原图上放大进行检测,放大尺度:小目标放大尺度大于大目标放大尺度
- 将得到的目标框合并然后NMS,通过控制K的数量可以在效率和精度之间trade off
- 骨干网络使用了改进的hourglass沙漏网络,更浅,参数更少
- 在1080Ti(44GB显存)上就可以进行训练,而CornerNet 需要在Titan X (PASCAL) GPUs with a total of 120GB GPU !!!
CornerNet-Squeeze
使用了轻量级的沙漏网络,速度更快,参数更少
noval hourglass network
- 原本的沙漏网络是基于residual blocks的,新的沙漏网络采用fire module 代替,减少参数量
- 把3*3 的标准卷积换成了3 * 3 的深度可分离卷积
实验结果
[外链图片转存失败(img-q2hjzPDE-1567866105044)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1561104613924.png)]
CornerNet-Saccade
将attention maps 换成GT后AP上升8%,说明Attention maps还有可以改进的空间
[外链图片转存失败(img-RLhHK29n-1567866105047)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1561104921108.png)]
CornerNet-Squeeze
性能优于YOLOV3:
[外链图片转存失败(img-0x42oimJ-1567866105049)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1561105063959.png)]