Face R-CNN
首先使用预先训练好的卷积网络提取conv特征。然后,RPN生成候选方案,Fast R-CNN对结果进行优化。PRN和Fast R-CNN共享底层conv特性。
1.联合了softmax loss + center loss,增加类间距离、增强类内判别度。
softmax只专注于类间差异,忽略了类内差异
center loss可以减少人脸类内差异性,center loss通过最小化样本与所属类中心距离,将所学到的特征更加集中于类内,就达到了进一步增大类间差异的目的。
xi就是RPN提取到的proposal,经过ROI pooling和全连接层提到的特征;Cyi 是xi所属的类中心,是一个与xi同维度的特征向量;loss目的就是为了让每个特征xi与其对应中心 Cyi 的距离进一步靠近。在每次迭代中,Cyi 都会进行更新,有点类似于kmeans算法。
分类:softmax + center loss;回归:SmoothL1 loss
2.Online Hard Example Mining (OHEM)
加入在线困难样本挖掘(OHEM),每次从正负样本中各选出loss最大的N个样本加入下次训练,提高对困难样本的的分类能力。
3.Multi-Scale Training
多尺度训练,为了适应不同尺度影响(或者更好地检测小目标),训练阶段图片会经过不同尺度缩放。
没有对所有的训练图像使用固定的尺度,而是通过在训练过程中将原始图像的大小调整到不同的大小,为每个图像设计了一个多尺度表示。这样,学习到的模型更适合低分辨率的人脸。
在测试过程中,相应进行多尺度测试,并将预测到的不同图像尺度的框组合成最终输出。