一张图解释网络
使用卷积得到目标的左上角和右下角,再通过预测得到的热土来进一步判断他是否属于角点,根据热土预测的embeddings向量,这些向量的距离进行判断是否为同一个物体。
每一个角点不是1就是0,那么就会导致召回率不过低
Corner Pooling的提出
作者发现我们预测的一些红色(不正确)的框也是很接近正确框的(与gt box 有很高的iou),因此作者改造了一个新的focal loss来缓解这种情况
实际生活中许多物体并没有角状,比如圆形的餐盘、条形的绳子等,因此并没有直观明显的视觉特征来表征角点。于是,为了在角点处获取到物体特征,我们需要将物体的特征汇集到角点处。比如对于左上角,可以将其水平向右以及竖直向下的特征都“收集”过来;而对于右下角点,则将其水平向左以及竖直向上的特征“收集”过来。
引用一个很厉害的博客的解析(他解释的很全面)
https://blog.csdn.net/fengdu78/article/details/115912263