1:检测模块,使用7*7和5*5的的窗口增加了特征map之后的感受野
2:使用了推荐窗口,在不同的特征map上检测人脸;
3:训练的时候,只是用anchor_layer,只是判断一下anchors的的正负类,测试的时候,使用使用proposal_layer,和faster相比,少了ROI层,速度较快;
4:可以使用对尺度的训练方式,进一步的增加精度;
5: 不同的特征map之间进行eltwise时要求大小map相等,通道也要相等;不同的特征map之间可以使用crop操作;
6: 采用是单边固定的方式来训练SSH的,和faster是一样的,可以采用多尺度的训练,同时也可以采用多尺度的测试;
7:不同的特征map采用不同的anchors,来检测不同大小的人脸;
8:OHEM是文章的一个大的创新点;
训练的结构图如下: