论文阅读【CenterNet】

最新推荐文章于 2023-03-30 20:55:24 发布

Rock_Huang~

最新推荐文章于 2023-03-30 20:55:24 发布

阅读量793

点赞数

分类专栏：论文阅读

本文链接：https://blog.csdn.net/weixin_38632246/article/details/100574796

版权

论文阅读专栏收录该内容

9 篇文章 6 订阅

订阅专栏

代码：https://github.com/xingyizhou/CenterNet
论文地址： https://arxiv.org/abs/1904.08189

还有一篇重名？https://arxiv.org/pdf/1904.08189.pdf https://github.com/Duankaiwen/CenterNet
在这里插入图片描述

文章要点：

针对基于anchor的检测方法（yolo v2-yolo v3，SSD ，faster-rcnn）在特征图中产生大量的bounding box 用于分类和位置修正，要求大量的计算资源消耗，额外的后处理，Loss复杂等。

文章就提出anchor-free的方式，通过Keypoint（中心点）和距离中心点的box的w，h回归box大小，外加offset偏移，这就节省了NMS操作。本文也是对CornerNet的改进。

实验结果：COCO数据上表现出:

AP	FPS
28.1%	142FPS
37.4%	52FPS
45.1%	1.4FPS

LOSS定义：

一：中心关键点Y的Loss

LOSS分为3个部分，首先，为中心关键点Y的Loss：
对于一幅输入（W, H）图像，经过CNN产生一个heatMap = $\frac{W}{R}\times \frac{H}{R}\times C$ ，用 $\widetilde{Y}$ 代表， $\widetilde{Y}$ $\epsilon$ [0,1], C表示关键点的类型数（维度？），例如，人体姿态估计C=17个关节点，C=80个目标检测物体类别，R表示特征图相比输入图缩放倍数，一般默认R=4，即heatmap缩小为原图的1/4.

首先groundtruth生成的关键点为 $P$ （具体先不解释这个，把BOX的坐标转换来的吧，），显示在预测低分辨率heatmap上为 $\widehat{P}$ = $P / R$ ，作者把CNN会生成heatmap 坐标与GroudTruth关键点使用高斯核函数标准化， $\sigma _{p}^{2}$ 表示自适应的标准方差。
在这里插入图片描述
$\widehat{Y}_{x,y,c}$ =1, 表示检测到一个关键点，
$\widehat{Y}_{x,y,c}$ =0，表示为背景
定义使用focal Loss： $\alpha$ =2 , $\beta$ =4 设为常数

二：offset Loss

缩小的输出heatmap 恢复到原图，中心点可能差生误差，需要添加一个位移偏置损失，先在处采集局步关键点（？没看懂）：
在这里插入图片描述
作者后面说O等于这个，后面看懂博主补充下：

然后算偏移量

在这里插入图片描述

三、box 大小损失（这里没有IOU哦）

Groudtruth 坐标为（ $X_{min}$ , $Y_{min}$ , $X_{max}$ , $Y_{max}$ ）, 中心点为 $P_{k}$ 为：
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190906143136995.png

$S_{k}$ 表示box的W，H：
在这里插入图片描述
坐标损失用预测的（w，h）集合 $\widehat{S}_{pk}$ 与每个关键点P的GroundTruth标记的（w，h）相减求平均值

总的Loss定义为：中心点损失+偏移损失+box大小损失， $\lambda_{size}$ =0.1 , $\lambda_{off}$ =1 ,用于权衡各项损失的比重
在这里插入图片描述

放张图，缓解一下硬核理论：
在这里插入图片描述

文章中给的实验对比图，可以稍作参考，具体表现还真不能拿这个定，亲测。。。。
在这里插入图片描述

Rock_Huang~

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
论文阅读【CenterNet】

代码：https://github.com/xingyizhou/CenterNethttps://github.com/Duankaiwen/CenterNet论文地址： https://arxiv.org/abs/1904.08189文章要点：针对基于anchor的检测方法（yolo v2-yolo v3，SSD ，faster-rcnn）在特征图中产生大量的bounding bo...
复制链接

扫一扫