CenterNet目标检测【详解】

全息数据

已于 2023-06-01 09:56:24 修改

阅读量1.4w

点赞数 26

分类专栏：图像算法深度学习文章标签：目标检测深度学习

于 2022-07-27 13:39:10 首次发布

本文链接：https://blog.csdn.net/qq_23022733/article/details/126007544

版权

深度学习同时被 2 个专栏收录

80 篇文章

订阅专栏

图像算法

66 篇文章

订阅专栏

文章目录

CenterNet网络框架：
在这里插入图片描述

1、CornerNet 和ExtremeNet

CornerNet ：预测左上角的点和右下角的点，共2个点；
ExtremeNet：预测最上面的点，最下面的点，最左边的点，最右边的点，中间的点，共5个点；
在这里插入图片描述

2、CenterNet模型流程

CenterNet预测中心点，中线点的宽高，中心点的残差；如下图，H x W x C中的C是类别数，

在这里插入图片描述

问题：为什么输出heads的wh和offset是2个通道，而不是2 $\times$ C呢？
答：因为在预测heatmap的时候会进行一些操作后，只取1个点，所以wh和offset只需预测2个通道。
优势：CenterNet会比基于anchor的检测模型减少误检

3、Backbone

Hourglass:主要用于关键点检测，效果好，缺点是权重多
Resnet：速度快，但效果不好
DLA：折中的方案

4、Heatmap与Loss

4.1 如何规定Heatmap GroundTruth

网络在预测heatmap中心点的时候，不是只在一个点为1，其他点为0；而是一个高斯分布，类似于山峰的形状，只要预测的中心点在这个高斯分布区域里面就可以

高斯分布的公式：
在这里插入图片描述
下面求出 $\ r$ ，分为3种情况，下面依次介绍，

在这里插入图片描述

首先介绍一下CornerNet，红框是GroundTruth，绿框是预测的，则预测框和GT有3种情形，分别计算IOU（3种情形的IOU保持一致），这里取IOU为0.7，再求出半径 r ，然后选出3种 r 的最小值。
在这里插入图片描述

（1）GT在预测框之内

overlap相当于IOU

在这里插入图片描述
（2) GT在预测框之外
(3)GT和预测框重叠，注意GT与预测框的wh是一样的，

4.2 Heatmap Loss

这是原始的Focal Loss， $\hat{Y}$ 是predict， $Y$ 是GT，

在这里插入图片描述

这是改进后的Focal Loss，即GT越接近于1， $(1-Y_{xyc})^\beta$ 越小，相应的非正样本的Loss就越小， $\alpha$ 和 $\beta$ 是超参数，
为什么要在前面乘以 $(1-Y_{xyc})^\beta$ ？我的答案：想让网络较少地学习接近于1的参数，这样网络就会较多地学习 $Y_{xyc}=1$ 时的参数。