yolov3.cfg文件详细说明

最新推荐文章于 2022-03-29 10:44:04 发布

angeldream999

最新推荐文章于 2022-03-29 10:44:04 发布

阅读量2.3k

点赞数

文章标签：深度学习神经网络人工智能

本文链接：https://blog.csdn.net/angeldream999/article/details/122102868

版权

本文对darknet源码中的yolov-voc.cfg重要参数详细解读说明，同时参考多个博客并融合个人理解，供初学者学习参考，谢谢！

[net] #net 为特殊的层，配置整个网络
#Testing
#batch=1
#subdivisions=1
#Training
#batch=64,sub=16表示训练过程中一次性加载64张图片进内存，然后分16次完成前向传播，每次4张，
#前向传播的循环过程中累加loss求平均，待64张图片都完成前向传播后，再反向传播更新参数
#batch越大，训练效果越好，subdivision越大，占用内存压力越小
#测试时batch=1,sub=1
batch=64
subdivisions=16
width=416 #输入网络的图片宽，值越大，小目标识别效果越好，只可设置为32的倍数
height=416 #输入网络的图片高，值越大，小目标识别效果越好，只可设置为32的倍数
channels=3 #输入图片的通道数
momentum=0.9 #最优化方法中的动量参数，影响梯度下降到最优的速度
decay=0.0005 #权重衰减正则项，防止过拟合
angle=0 #数据增强参数，通过旋转角度来生成更多训练样本
saturation = 1.5 #数据增强参数，通过调整饱和度来生成更多训练样本
exposure = 1.5 #数据增强参数，通过调整曝光量来生成更多训练
hue=.1 #数据增强参数，通过调整色调来生成更多训练
#学习率决定着权值更新的速度，设置得太大会使结果超过最优值，太小会使下降速度过慢。
#手动调整时，刚开始可将学习率设置高一些，学习率以 0.01 ~ 0.001为宜。一定轮数过后：逐渐减缓，
#可设置动态变化的学习率。接近训练结束：学习速率的衰减应该在100倍以上
#若loss波动过大则学习率过大,可适当减小(1/5,1/10);若几乎不变，说明已收敛或陷入局部最优，可增大。
learning_rate=0.001
burn_in=1000 #迭代次数大于burn_in时，学习率采用policy更新方式
max_batches = 50200 #训练次数达到max_batches后停止训练
policy=steps #学习率策略的调整，constant,steps,exp,ploy,step,sig,RANDOM,constant
#step和scale时设置学习率的变化，迭代到40000次时，学习率衰减10倍，迭代到40000次时，学习率再衰减10倍
steps=40000,45000
scales=.1,.1

[convolutional]#卷积层配置说明
batch_normalize=1 #是否进行BN处理
filters=32 #卷积核个数，也是输出通道数
size=3 #卷积核尺寸
stride=1 #卷积步长
pad=1 #是否进行0 padding，pad为1，则padding大小为卷积核size/2 向下取整
activation=leaky #激活函数类型

# Downsample

[convolutional]
batch_normalize=1
filters=64
size=3
stride=2
pad=1
activation=leaky

[convolutional]
batch_normalize=1
filters=32
size=1
stride=1
pad=1
activation=leaky

[convolutional]
batch_normalize=1
filters=64
size=3
stride=1
pad=1
activation=leaky

[shortcut] #shortcut层配置说明
from=-3 #与向前多少层进行融合，-3表示向前第三层
activation=linear #层激活函数

# Downsample

[convolutional]
batch_normalize=1
filters=128
size=3
stride=2
pad=1
activation=leaky

[convolutional]
batch_normalize=1
filters=64
size=1
stride=1
pad=1
activation=leaky

[convolutional]
batch_normalize=1
filters=128
size=3
stride=1
pad=1
activation=leaky