论文:Objects as Points
论文链接:https://arxiv.org/abs/1904.07850
代码链接:https://github.com/xingyizhou/CenterNet
本文主要讲解CenterNet的Regress Focal Loss,由热图部分(heatmap loss)、偏置部分(reg loss)、宽高(wh loss)部分三部分loss组成,附代码实现。
1. heatmap loss
输入图像∈ , W为图像宽度,H为图像高度。网络输出的关键点热图heatmap为 ∈,R代表得到输出相对于原图的步长stride。C代表类别个数。
下面是CenterNet中核心loss公式:
这个和Focal loss形式很相似, 和 是超参数,N代表的是图像关键点(也就是GT中被高斯平滑之后区域的像素)个数。
-
在 的时候,
对于易分样本来说,预测值 接近于1, 就是一个很小的值,这样loss就很小,起到了矫正作用。
对于难分样本来说,预测值 接近于0, 就比较大,相当于加大了其训练的比重。
总之,其实就是一个带权重的交叉熵,在一个目标点及其高斯平滑区域,正样本只有一个点的点,其他点都是负样本,负样本GT为,比如0.56.