实验记录
官方COWC数据集把汽车分为了'Pikup','Other','Sedan','Unkown'四个类别,将COWC中Utah部分的照片(12729张)作为训练集,Toronto(8700)的图片1比1拆分验证集和测试集进行训练。实验使用4个GPU,网络训练迭代总次数为 90000次,训练批量大小为 8,初始化学习率为0.001,在迭代 60000 次后降为 0.0001,权重衰减因子为 0.0001,优化器采用 SGD,动量为 0.9。网络最小输入为 256,最大输入为 640。结果如下:
|
|
|
|
|
|
|
FCOS |
0.330 |
0.532 |
0.370 |
0.369 |
0.395 |
-1 |
观察到数据中四个类别数量分布及每个类别识别AP如下,我便摒弃掉最后一个类别,将前三个类别合并成一个'Car'类别进行训练。
又考虑到数据集中图片来自多个城市,为提高模型泛化能力,进行颜色抖动、翻转和旋转等数据增强。结果如下:
|