VGG原论文训练过程

最新推荐文章于 2024-07-11 13:29:38 发布

打酱油QAQ

最新推荐文章于 2024-07-11 13:29:38 发布

阅读量1.2k

点赞数

分类专栏：深度学习实践文章标签：深度学习调参

本文链接：https://blog.csdn.net/qq_24906797/article/details/96006349

版权

深度学习实践专栏收录该内容

3 篇文章 0 订阅

订阅专栏

训练：

数据增强: 随机裁剪（crop）、水平翻转（horizontal flips）、RGB颜色变化（color shift）
采用2种设置训练图像大小方法：
（1）固定训练集图片大小，如256×256和384×384；
（2）让训练集的大小在一个范围内随机变化，如S∈[Smin,Smax]=[256,512]，多尺度训练
训练采用小批量梯度下降法加上动量（mini-batch stochastic gradient descent + momentum）,batch size = 256, momentum = 0.9;
正则化方法采用weight decay（L2罚函数乘子设为0.0005）,前两个全连接层使用dropout(p=0.5)；
学习率为0.01，且当验证集停止提升时以10的倍数衰减,一共降低了3次；
总迭代次数为370k (74 epochs), epochs指训练集完整遍历的次数
初始化权重取样于高斯分布N（0,0.01），偏置项初始化为0。

测试：
测试图片的尺寸不一定要与训练图片的尺寸相同，且不需要裁剪。
测试的时候，首先将全连接层转换到卷积层，第一个全连接层转换到一个7x7的卷积层，后面两个转换到1x1的卷积层，得到的特征图的通道数等于类别数，还有一个决定于输入图片尺寸的可变空间分辨率，每个通道单独average。最终交给softmax的是1x1x1000的feature map进行分类。

在这里插入图片描述