被大佬安利了这篇论文,花了整整一天的时间学习这篇论文,感觉非常妙。记录一下学习笔记,先推荐两篇个人觉得讲的非常好的文章,以下笔记有些内容摘自这里:
[1] https://zhuanlan.zhihu.com/p/66048276
[2] http://www.tensorinfinity.com/paper_189.html
[3] https://blog.csdn.net/c20081052/article/details/89358658
论文地址:https://arxiv.org/pdf/1904.07850.pdf
算法源码:https://github.com/xingyizhou/CenterNet
注:关于CenterNet网络有不同方法的两篇论文,只是撞了名字,另一篇叫《CenterNet:Keypoint Triplets for Object Detection》,这次学习的是《Objects as Points》中的CenterNet
1. CenterNet网络的核心思想与主要贡献
1.1 背景
和CornerNet的问政一样,文章第一段一上来就提到了One-Stage detector和Two-Stage detector的问题:没有拜托Anchor box和NMS等方法的问题,为了区分和训练anchor box的后处理存在一定难度(并且影响了定位精度)。这一部分在CornerNet的文章《CornerNet:Detecting Objects as Paired Keypoints》里详细介绍过,不再赘述,详见笔记:https://blog.csdn.net/weixin_42214565/article/details/100524611
文章第一段分析时提出了一种"端到端可训练"的概念,即对目标框的后处理参数也加入网络训练,这一点是One-Stage detector等方法没有做到的。
基于这么一个大问题,作者提出了CenterNet构架。
1.2 核心思想
摈弃了anchor box的概念和它的修正方法,将bounding box用特征中心点和宽高尺寸表示,把目标检测问题定义为一个标准关键点(中心点)的估计问题,借鉴了CornerNet的结构思路,用全卷积层(沙漏网络)预测heatmap,heatmap中包含中心点和宽高信息。整体的框架和损失函数一定程度上借鉴了CornerNet,并在其基础上做了一定改进。
1.3 主要贡献
CenterNet创新之处在于:
1. 用heatmap预测的目标中心点代替anchor预测目标,使用更大分辨率的输出特征图(缩放了4倍),因此无需用到多重特征图Anchor,整个框架真正做到了Anchor Free,实现了“端到端可训练”
2. 网络非常易于拓展,文中主