pycaffe生成solver文件并运行

其实没有必要写这篇博文的,网上很多大佬都写过同样的博客,而且写的还非常好,但是呢?毕竟也是自己的学习经历,还是做一下记录吧。看到此处的朋友请移步这篇大佬的博文Caffe学习笔记(五):使用pycaffe生成solver.prototxt文件并进行训练,你将获益匪浅,就不用在这里耽误时间了。

使用pycaffe生成solver文件

# 如何利用pycaffe 生成 solver 文件

from caffe.proto import caffe_pb2

s = caffe_pb2.SolverParameter() # 封装了 solver文件的类

# 定义solver文件的参数
s.train_net = "train.prototxt" # 要训练的网络
s.test_net.append('test.prototxt') # 定义测试网络

s.test_interval = 100 # 训练多长时间测试一次
s.test_iter.append(10) # 测试迭代数,
# 例如:有10000个测试样本,batch_size设为32,
# 那么就需要迭代 10000/32=313次才完整地测试完一次,所以设置test_iter为313。

s.max_iter = 1000 # 最大迭代次数

s.base_lr = 0.1 # 基础学习率

s.weight_decay = 5e-4 # 定义学习率 衰减率

s.lr_policy = 'step' # 定义学习率更新的方式

s.display = 10 # 定义打印网络的间隔

s.snapshot = 10 # 定义 caffemodel 存储的间隔

s.snapshot_prefix = 'model' # 定义caffemodel存放的路径,这里指的是前缀,前面可以加路径

s.type = 'SGD' # 网络优化 类别

s.solver_mode = caffe_pb2.SolverParameter.GPU # 采用 gpu 还是 cpu

# 最后保存 solver 文件
with open("net/s.prototxt", 'w') as f: # 保存sovler文件
    f.write(str(s))

lr_prolicy参数说明:

  • fixed: 保持base_lr不变;
  • step: step: 如果设置为step,则需要设置一个stepsize,返回base_lr * gamma ^ (floor(iter / stepsize)),其中iter表示当前的迭代次数;
  • exp: 返回base_lr * gamma ^ iter,iter为当前的迭代次数;
  • inv: 如何设置为inv,还需要设置一个power,返回base_lr * (1 + gamma * iter) ^ (- power);
  • multistep: 如果设置为multistep,则还需要设置一个stepvalue,这个参数和step相似,step是均匀等间隔变化,而multistep则是根据stepvalue值变化;

stepvalue参数说明:

  • poly: 学习率进行多项式误差,返回base_lr (1 - iter/max_iter) ^ (power);
  • sigmoid: 学习率进行sigmod衰减,返回base_lr ( 1/(1 + exp(-gamma * (iter - stepsize))))。

运行solver文件

import caffe

# 只需指定 solver 文件的路径 即可
solver = caffe.SGDSolver("/data/cnn_net/lenet/lenet_solver.prototxt")

solver.solve()
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值