按时间排序的anchor free论文
为什么要anchor free?
1、anchor的数量 大小 和宽高比这些超参要调
2、dense anchor boxes create a huge imbalance between positive and negative anchor boxes during training. This imbalance causes the training to be inefficient and hence the performance to be suboptimal
CornerNet: Detecting Objects as Paired Keypoints
两个角点预测分支和偏移量预测分支 :预测了两个分支的HxWxC的热图,C是类别数 不含背景类。
whose center is at the positive location and whose σ is 1/3 of the radius
pcij 是类别c在(i,j)上的预测得分,ycij 是用高斯核增强后的gt
原图中(x,y)的位置映射到热力图上是(x/n,y/n),n是下采样因子。
为什么要预测偏移量?因为卷积网络输出的heatmap大小和原图大小不一致,映射会原图会有精度的损失。
embedding分支:loss只用于GT角点位置
左上角的点与右下角的点如果属于同一bounding box,则他们embedding的向量之间的距离应该要小
Corner Pooling:
对于左上角的点,需要水平方向往右找到上边界,垂直方向下找到右边界
测试阶段:
(1)、对heatmap使用maxpooling (相当于做了NMS)
(2)、选择top100的左上角点和top100右下角点,左上角右下角点根据embedding的L1距离来匹配成对,>0.5就不成对
(3)、左上角和右下角点的score取均值作为最终的框的置信度。原图和翻转图送到网络得到框在做soft-NMS
创新点/优点:
(1)对每个角点预测了一个embedding的特征
(2)提出了cornerpooling的操作:左上的角点分别从右往左 和从下往上求最大值的