调参情况
目录
一、原始结构上的参数调整
1. ROI与黑白框
ROI |
|
| mAP(%) |
不加ROI |
|
| 50.06 |
[0 352] | [100 260] | 白框 | 45.93 |
|
| 黑框 | 51.72 |
[0 352] | [100 270] | 黑框 | 52.40 |
[0 352] | [100 280] | 白框 | 43.29 |
|
| 黑框 | 53.49 |
彻底舍弃白框ROI
ROI |
|
| mAP(%) |
不加ROI |
|
| 50.06 |
[0 352] | [100 260] | 黑框 | 51.72 |
[0 352] | [100 270] | 黑框 | 52.40 |
[0 352] | [100 280] | 黑框 | 53.49 |
[0 352] | [100 290] | 黑框 | 54.08 |
[0 352] | [100 300] | 黑框 | 54.40 |
| [100 305] |
| 53.93 |
[0 352] | [100 310] | 黑框 | 54.43 |
| [100 315] |
| 54.38 |
[0 352] | [100 320] |
| 53.01 |
[0 352] | [100 330] |
| 51.87 |
| [10 310] |
|
|
| [20 310] |
| 56.07 |
| [30 310] |
| 56.19 |
| [40 310] |
| 57.70 |
| [45 310] |
| 57.36 |
| [50 310] |
| 57.19 |
| [60 310] |
| 56.64 |
| [70 310] |
|
|
| [80 310] |
| 55.54 |
| [90 310] |
| 54.99 |
| [100 310] |
| 54.43 |
| [110 310] |
| 53.58 |
| [150 310] |
| 42.62 |
确定了右边的框为[40 310]
[] | [40 310] |
|
| 57.70 |
[10 352] |
|
|
| 56.69 |
[10 320] |
|
|
| 56.69 |
[30 352] |
|
|
| 54.34 |
[50 352] |
|
|
| 48.57 |
[0 280] |
|
|
| 56.59 |
[0 300] | [40 310] |
|
| 57.70 |
[0 320] |
|
|
| 57.70 |
[0 340] |
|
|
| 57.70 |
ROI参数固定为[40 300]
2. minsize face to detect
Minisize of face to detect | mAP(%) |
20 | 57.70 |
30 | 59.98 |
33 | 59.79 |
34 | 59.74 |
35 | 60.37 |
36 | 59.42 |
37 | 60.00 |
40 | 57.28 |
50 | 51.66 |
ROI定为
[0 300] | [40 310] |
MiniSize of face定为 35
scale stride
测试stride
初始0.7 | 60.37 |
0.9 | 60.91 |
0.8 | 60.56 |
0.5 | 59.24 |
二、新网络结构的参数调整
(pnet与rnet更改,onet为原版onet代码)
ROI=[0,300,40,310]
2.1 minsize的调整
scale stride=0.9
minsize | mAP(%) |
35 | 61.84 |
32 | ~=62 |
30 | 63.08 |
27 | ~=62 |
25 | 62.43 |
2.2 scale stride
scale stride | mAP(%) |
0.95 | 60.97 |
0.9 | 63.08 |
0.85 | 61.94 |
0.7 | 59.78 |
三、新结构
只有3×3的卷积,后两层padding都为same.
有7层卷积
3.1 关于nms的阈值。
可以增大相应的阈值来增大查准率precision,减小recall
关于非极大值抑制的阈值
非极大值抑制的方法是:假设有6个矩形框,根据分类器的类别分类概率做排序,假设从小到大的概率 分别为A、B、C、D、E、F。
(1)从最大概率矩形框F开始,分别判断A~E与F的重叠度IOU是否大于某个设定的阈值;
(2)假设B、D与F的重叠度超过阈值,那么就扔掉B、D;并标记第一个矩形框F,是我们保留下来的。
(3)从剩下的矩形框A、C、E中,选择概率最大的E,然后判断E与A、C的重叠度,重叠度大于一定的阈值,那么就扔掉;并标记E是我们保留下来的第二个矩形框。
就这样一直重复,找到所有被保留下来的矩形框。
阈值越大,则融合更不容易,产生的备选框越多
阈值设置 | mAP(%) |
inter scale nms: 0.5 pnet nms阈值:0.7 rnet nms阈值:0.7 onet nms阈值:0.7 | 62.97 |
inter scale nms: 0.5 pnet nms阈值:0.7 rnet nms阈值:0.9 onet nms阈值:0.7 | 64.65 |
inter scale nms: 0.5 pnet nms阈值:0.7 rnet nms阈值:0.9 onet nms阈值:0.9 | 58.05 |
inter scale nms: 0.7 pnet nms阈值:0.9 rnet nms阈值:0.9 onet nms阈值:0.7 | 65.08 |
inter scale nms: 0.4 pnet nms阈值:0.6 rnet nms阈值:0.8 onet nms阈值:0.7 | 62.92 |
inter scale nms: 0.5 pnet nms阈值:0.5 rnet nms阈值:0.7 onet nms阈值:0.6 | 60.73 |
对阈值调参,考虑到运行速度,nms的阈值暂时选用
增大阈值会增大precision,减小recall
inter scale nms: 0.5
pnet nms阈值:0.7
rnet nms阈值:0.7
onet nms阈值:0.7
Three thresholds for pnet, rnet, onet | mAP(%) |
[0.8, 0.8, 0.8] | 62.97 |
[0.9, 0.8, 0.9] | 63.09 |
[0.8, 0.8, 0.9] | 62.29 |
[0.9, 0.9, 0.95] | 60.57 |
[0.9, 0.8, 0.95] | 62.66 |
[0.8, 0.8, 0.95] | 62.29 |