训练:
- 数据增强: 随机裁剪(crop)、水平翻转(horizontal flips)、RGB颜色变化(color shift)
- 采用2种设置训练图像大小方法:
(1)固定训练集图片大小,如256×256和384×384;
(2)让训练集的大小在一个范围内随机变化,如S∈[Smin,Smax]=[256,512],多尺度训练 - 训练采用小批量梯度下降法加上动量(mini-batch stochastic gradient descent + momentum),batch size = 256, momentum = 0.9;
- 正则化方法采用weight decay(L2罚函数乘子设为0.0005),前两个全连接层使用dropout(p=0.5);
- 学习率为0.01,且当验证集停止提升时以10的倍数衰减,一共降低了3次;
- 总迭代次数为370k (74 epochs), epochs指训练集完整遍历的次数
- 初始化权重取样于高斯分布N(0,0.01),偏置项初始化为0。
测试:
测试图片的尺寸不一定要与训练图片的尺寸相同,且不需要裁剪。
测试的时候,首先将全连接层转换到卷积层,第一个全连接层转换到一个7x7的卷积层,后面两个转换到1x1的卷积层,得到的特征图的通道数等于类别数,还有一个决定于输入图片尺寸的可变空间分辨率,每个通道单独average。最终交给softmax的是1x1x1000的feature map进行分类。