训练指令
python ./faster_rcnn/train_net.py --gpu 0 --restore 0 --weights ./data/pretrain_model//VGG_imagenet.npy --imdb voc_2007_trainval --iters 70000 --cfg ./experiments/cfgs/faster_rcnn_end2end.yml --network VGGnet_train --set EXP_DIR exp_dir
调整 batch size 的大小
./experiments/cfgs 下的faster_rcnn_end2end.yml文件
BATCH_SIZE: 16 # 训练ROI的 batch size
RPN_BATCHSIZE: 16 # 训练RPN的 batch size
生成pyc文件
python -m compileall xxx.py
另发现train.py中:
1.若使用:
config.gpu_options.allow_growth = True
则调整batch size的大小,不怎么影响显存占用,训练起来显存使用都是 4638MiB
训练过程中的速度:
iter: 0 / 70000, total loss: 5.8428, rpn_loss_cls: 1.2238, rpn_loss_box: 1.6017, loss_cls: 2.9636, loss_box: 0.0538, lr: 0.001000
speed: 2.127s / iter
image: 004257.jpg iter: 10 / 70000, total loss: 4.0838, rpn_loss_cls: 1.2091, rpn_loss_box: 0.3118, loss_cls: 1.3367, loss_box: 1.2262, lr: 0.001000
speed: 0.217s / iter
image: 004868.jpg iter: 20 / 70000, total loss: 4.4199, rpn_loss_cls: 1.2309, rpn_loss_box: 0.7306, loss_cls: 1.3177, loss_box: 1.1408, lr: 0.001000
speed: 0.197s / iter
image: 000712.jpg iter: 30 / 70000, total loss: 3.8362, rpn_loss_cls: 1.1389, rpn_loss_box: 0.2248, loss_cls: 1.3395, loss_box: 1.1330, lr: 0.001000
speed: 0.199s / iter
2.若使用
config.gpu_options.per_process_gpu_memory_fraction = 0.40
则调整batch size的大小,可以使用0.4的显存占用率训练。
调整batch size最大等于32,可以在0.4占用率下训练;
python ./faster_rcnn/train_net.py --gpu 0 --restore 0 --weights ./data/pretrain_model//VGG_imagenet.npy --imdb voc_2007_trainval --iters 70000 --cfg ./experiments/cfgs/faster_rcnn_end2end.yml --network VGGnet_train --set EXP_DIR exp_dir
调整 batch size 的大小
./experiments/cfgs 下的faster_rcnn_end2end.yml文件
BATCH_SIZE: 16 # 训练ROI的 batch size
RPN_BATCHSIZE: 16 # 训练RPN的 batch size
生成pyc文件
python -m compileall xxx.py
另发现train.py中:
1.若使用:
config.gpu_options.allow_growth = True
则调整batch size的大小,不怎么影响显存占用,训练起来显存使用都是 4638MiB
训练过程中的速度:
iter: 0 / 70000, total loss: 5.8428, rpn_loss_cls: 1.2238, rpn_loss_box: 1.6017, loss_cls: 2.9636, loss_box: 0.0538, lr: 0.001000
speed: 2.127s / iter
image: 004257.jpg iter: 10 / 70000, total loss: 4.0838, rpn_loss_cls: 1.2091, rpn_loss_box: 0.3118, loss_cls: 1.3367, loss_box: 1.2262, lr: 0.001000
speed: 0.217s / iter
image: 004868.jpg iter: 20 / 70000, total loss: 4.4199, rpn_loss_cls: 1.2309, rpn_loss_box: 0.7306, loss_cls: 1.3177, loss_box: 1.1408, lr: 0.001000
speed: 0.197s / iter
image: 000712.jpg iter: 30 / 70000, total loss: 3.8362, rpn_loss_cls: 1.1389, rpn_loss_box: 0.2248, loss_cls: 1.3395, loss_box: 1.1330, lr: 0.001000
speed: 0.199s / iter
2.若使用
config.gpu_options.per_process_gpu_memory_fraction = 0.40
则调整batch size的大小,可以使用0.4的显存占用率训练。
调整batch size最大等于32,可以在0.4占用率下训练;
若增大batch size,则必须对应增大显存占用率。
注:本机配置8700K+1080