又是一个用Faster R-CNN框架做人脸检测的,公开测试集指标又高了。T_T
文章链接 《Face R-CNN》http://cn.arxiv.org/abs/1706.01061
大体的框架保持不变:
主要改进点:
(1) Center loss
对于最后的二分类,在softmax的基础上增加了center loss。为了使得center loss均衡,一个mini batch中正负样本比例限制为1:1.
(2) Online Hard Example Mining (OHEM)
每次从正负样本中各选出loss最大的N个样本加入下次训练。
(3) Multi-Scale Training
为了弱化尺度影响(或者更好地检测小目标),训练阶段图片会经过不同尺度缩放。
FDDB上效果如下:
思考
(1) 这里的center loss应当不难训练;
(2)很多优化技巧都可以提高人脸检测(神经网络)的效果,还比如knowledge distilling(亲测有用)。
(3)关于样本比例的事情,其他地方大多采用正:负=1:3。 讲真,这个比例有时候还是挺影响训练的。特别是做阈值判定的时候。