Abstract
使用一对关键点来预测检测框,该对关键点为左上角点和右下角点,不使用anchor,另外文章还提出corner pooling。
Introduction
作者认为使用 anchor box有两个缺点:1.正负样本不均衡,密集采样anchor box,但只有少部分的anchor box中有ground truth。2.引入许多超参数,如个数,大小,长宽比。
使用一个ConvNet预测左上角点和右下角点的Heatmap以及enbedding vector,如下图。
为何角点预测比使用anchor box更好 1)目标框中心难以确定因为取决于目标的四个边,而角点只依赖于目标的两个边,相对来说定位更容易;2)角点提供了更为有效的离散边界空间,对角点而言为O(wh),而对anchor boxes而言为O(w2h2)。
CornerNet
使用hourglass network作为backbone,然后跟了俩个预测模块。分别是左上角点和右下角点的预测,每个模块有自己的Corner pooling模块