CornerNet(左上角点+右下角点)
CornerNet: Detecting Objects as Paired Keypoints
(ECCV 2018)
论文主要提出一个基于目标的左上角点和右下角点这两个关键点进行目标检测的方法,同时还提出了Corner Pooling这种池化方式,有效提取角点处特征。最后将检测出的角点进行配对,最终给出属于该目标的最优框坐标。
CornerNet用的主干网络是用在关键点检测领域表现很好的沙漏网络(Hourglass Network)。算法的整体思路是,首先通过两个五阶的Hourglass Network网络进行特征提取,紧接着将网络得到的特征输入到两个模块:Top-left Corner pooling和Bottom-right Corner pooling提取关键点的特征,对于每个Corner Pooling模块都会进行目标框的左上角关键点和右下角关键点的类别分类(Heatmaps),并找到每个目标的配对关键点(Embeddings),以及减少基于坐标回算目标位置时的偏置(offsets)。网络的整体结构图如下:
图1 CornerNet 算法示意图
下面首先介绍提取特征的Hourglass沙漏网络。Hourglass网络由Residual模型堆叠多层下采样及上采样分支而成,多用于人体关键点的检测和姿态估计。沙漏网络成堆叠结构,一般被称为Stacked hourglass network,主要的贡献在于利用多尺度来提取目标特征。网络结构形似沙漏状,使用 Residual Module 作为基本的网络单元,使用两层3*3卷积核提取特征,在卷积层中间会有BN层和Relu层,高速通道使用1*1卷积, 在residu module中,所有卷积层的步长为1,pading为1,不改变数据尺