论文学习:《Objects as Points》

本文详述了CenterNet的核心思想与主要贡献,抛弃了anchor box,通过预测目标中心点和尺寸解决检测问题。该网络实现了端到端训练,且易于拓展,适用于3D目标检测和人体姿态估计。损失函数包括中心回归损失、目标尺寸损失和中心点下采样偏置。
摘要由CSDN通过智能技术生成

被大佬安利了这篇论文,花了整整一天的时间学习这篇论文,感觉非常妙。记录一下学习笔记,先推荐两篇个人觉得讲的非常好的文章,以下笔记有些内容摘自这里:

[1] https://zhuanlan.zhihu.com/p/66048276

[2] http://www.tensorinfinity.com/paper_189.html

[3] https://blog.csdn.net/c20081052/article/details/89358658

论文地址:https://arxiv.org/pdf/1904.07850.pdf

算法源码:https://github.com/xingyizhou/CenterNet

注:关于CenterNet网络有不同方法的两篇论文,只是撞了名字,另一篇叫《CenterNet:Keypoint Triplets for Object Detection》,这次学习的是《Objects as Points》中的CenterNet

1. CenterNet网络的核心思想与主要贡献

1.1 背景

和CornerNet的问政一样,文章第一段一上来就提到了One-Stage detector和Two-Stage detector的问题:没有拜托Anchor box和NMS等方法的问题,为了区分和训练anchor box的后处理存在一定难度(并且影响了定位精度)。这一部分在CornerNet的文章《CornerNet:Detecting Objects as Paired Keypoints》里详细介绍过,不再赘述,详见笔记:https://blog.csdn.net/weixin_42214565/article/details/100524611

文章第一段分析时提出了一种"端到端可训练"的概念,即对目标框的后处理参数也加入网络训练,这一点是One-Stage detector等方法没有做到的。

基于这么一个大问题,作者提出了CenterNet构架。

 

1.2 核心思想

摈弃了anchor box的概念和它的修正方法,将bounding box用特征中心点和宽高尺寸表示,把目标检测问题定义为一个标准关键点(中心点)的估计问题,借鉴了CornerNet的结构思路,用全卷积层(沙漏网络)预测heatmap,heatmap中包含中心点和宽高信息。整体的框架和损失函数一定程度上借鉴了CornerNet,并在其基础上做了一定改进。

1.3 主要贡献

CenterNet创新之处在于:

1. 用heatmap预测的目标中心点代替anchor预测目标,使用更大分辨率的输出特征图(缩放了4倍),因此无需用到多重特征图Anchor,整个框架真正做到了Anchor Free,实现了“端到端可训练”

2. 网络非常易于拓展,文中主

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值