用自制数据训练修改过的基于caffe的fcn网络时loss在一个较大值震荡的解决方法

最新推荐文章于 2024-08-08 03:12:58 发布

Halostudio

最新推荐文章于 2024-08-08 03:12:58 发布

阅读量4.6k

点赞数 1

本文链接：https://blog.csdn.net/xuezhi1001/article/details/78435906

版权

基于caffe的fcn网络训练自制数据时loss在一个较大值震荡的解决方法

用自己数据训练修改后的fcn网络，可能会遇到loss在一个较大值附近震荡。通过查询资料和借助网络资源，初步有两个比较好的方法来处理这个问题；训练网络时初始化权重对训练的影响比较大。做过这样的测试，训练网络数据利用默认初始化方式，loss降到一个较大值附近就不下降了。通过已有网络赋值，或者其他初始化权重方式可以获得不错的训练效果。具体操作如下

1.就是利用已有的网络来初始化网络权重，具体修改solve.py文件是

import caffe
import surgery, score

import numpy as np
import os
import sys

try:
import setproctitle
setproctitle.setproctitle(os.path.basename(os.getcwd()))
except:
pass

weights = '../ilsvrc-nets/fcn32s-heavy-pascal.caffemodel'

vgg_weights = '../ilsvrc-nets/vgg16-fcn.caffemodel'
vgg_proto = '../ilsvrc-nets/VGG_ILSVRC_16_layers_deploy.prototxt'
weights = '../ilsvrc-nets/vgg16-fcn.caffemodel'

# init
caffe.set_device(0)
caffe.set_mode_gpu()

solver = caffe.SGDSolver('solver.prototxt')
#solver.net.copy_from(weights)
vgg_net=caffe.Net(vgg_proto,vgg_weights,caffe.TRAIN)
surgery.transplant(solver.net,vgg_net)
del vgg_net

# surgeries
interp_layers = [k for k in solver.net.params.keys() if 'up' in k]
surgery.interp(solver.net, interp_layers)

# scoring
val = np.loadtxt('F:/data/paopao/seg11valid.txt', dtype=str)

for _ in range(25):
solver.step(4000)
score.seg_tests(solver, False, val, layer='score')