论文学习：《Objects as Points》

最新推荐文章于 2023-07-05 16:54:00 发布

Crazy_Omais

最新推荐文章于 2023-07-05 16:54:00 发布

阅读量875

点赞数

文章标签： CenterNet

本文链接：https://blog.csdn.net/weixin_42214565/article/details/100544887

版权

本文详述了CenterNet的核心思想与主要贡献，抛弃了anchor box，通过预测目标中心点和尺寸解决检测问题。该网络实现了端到端训练，且易于拓展，适用于3D目标检测和人体姿态估计。损失函数包括中心回归损失、目标尺寸损失和中心点下采样偏置。

摘要由CSDN通过智能技术生成

被大佬安利了这篇论文，花了整整一天的时间学习这篇论文，感觉非常妙。记录一下学习笔记，先推荐两篇个人觉得讲的非常好的文章，以下笔记有些内容摘自这里：

[1] https://zhuanlan.zhihu.com/p/66048276

[2] http://www.tensorinfinity.com/paper_189.html

[3] https://blog.csdn.net/c20081052/article/details/89358658

论文地址：https://arxiv.org/pdf/1904.07850.pdf

算法源码：https://github.com/xingyizhou/CenterNet

注：关于CenterNet网络有不同方法的两篇论文，只是撞了名字，另一篇叫《CenterNet：Keypoint Triplets for Object Detection》，这次学习的是《Objects as Points》中的CenterNet

1. CenterNet网络的核心思想与主要贡献

1.1 背景

和CornerNet的问政一样，文章第一段一上来就提到了One-Stage detector和Two-Stage detector的问题：没有拜托Anchor box和NMS等方法的问题，为了区分和训练anchor box的后处理存在一定难度（并且影响了定位精度）。这一部分在CornerNet的文章《CornerNet：Detecting Objects as Paired Keypoints》里详细介绍过，不再赘述，详见笔记：https://blog.csdn.net/weixin_42214565/article/details/100524611

文章第一段分析时提出了一种"端到端可训练"的概念，即对目标框的后处理参数也加入网络训练，这一点是One-Stage detector等方法没有做到的。

基于这么一个大问题，作者提出了CenterNet构架。

1.2 核心思想

摈弃了anchor box的概念和它的修正方法，将bounding box用特征中心点和宽高尺寸表示，把目标检测问题定义为一个标准关键点（中心点）的估计问题，借鉴了CornerNet的结构思路，用全卷积层（沙漏网络）预测heatmap，heatmap中包含中心点和宽高信息。整体的框架和损失函数一定程度上借鉴了CornerNet，并在其基础上做了一定改进。

1.3 主要贡献

CenterNet创新之处在于：

1. 用heatmap预测的目标中心点代替anchor预测目标，使用更大分辨率的输出特征图（缩放了4倍），因此无需用到多重特征图Anchor，整个框架真正做到了Anchor Free，实现了“端到端可训练”

2. 网络非常易于拓展，文中主

最低0.47元/天解锁文章

Crazy_Omais

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫