接上一篇博客,持续更新CSP的源码解读.
论文名称: High-level Semantic Feature Detection: A New Perspective for Pedestrian Detection
论文地址: https://arxiv.org/abs/1904.02948
代码地址: https://github.com/liuwei16/CSP
这次先来看CSP的Loss是怎么做的,
要想求Loss,必须有两个量: 预测值和标签. 预测值自然就是网络的输出,这个还算好理解,然而这篇文章中的标签就不是普通的标签了,因为使用了 anchor free 的方法,这篇文章将 ground truth 的标签设置成了一张高斯掩码图,与我们常用的方式有很大不同. 所以这篇博客就重点讲讲CSP是怎么生成自己的标签的.
1. 数据集:
首先是数据集,我们以 cityperson 为例, cityperson 数据集的标注和图片分别存放在两个文件夹下,使用方式,通常是先读取标注文件, 标注文件是一个字典, 字典中包含了bbox filepath等信息, 根据其中图片的路径, 就能读取到读取图片了.
图片路径如图所示 (data/cache/cityperson/val_500) , 输出其中一张图片的信息如图. 然后我们用源码给的数据生成脚本看一下生成后的数据是啥样儿的....
2. 生成数