caffe脚本

最新推荐文章于 2018-08-18 09:20:35 发布

ccemmawatson

最新推荐文章于 2018-08-18 09:20:35 发布

阅读量796

点赞数

分类专栏： caffe

本文链接：https://blog.csdn.net/ccemmawatson/article/details/42102021

版权

caffe 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

Net
网络就是由层组合成的
name: "dummy-net"
layers { name: "data" ...}
layers { name: "conv" ...}
layers { name: "pool" ...}
LogReg ↑
... more layers ...
layers { name: "loss" ...}

初始化网络的时候会检查合法性
数据前向和后向流动通过blob

Layer
name: "conv1" 层名称
type: CONVOLUTION 类型：常见的有DATA，CONVOLUTION，POOLING
bottom: "data" 输入块名称，这里不是层名称
top: "conv1" 输出块名称，这个块就是一坨数据
convolution_param 这一层的指定参数
{
num_output: 20 这应该是总共有多少个卷积核
kernel_size: 5
stride: 1
weight_filler { 这个参数不知道啥意思
type: "xavier"
}
}

层指定参数：
Setup 初始化的时候运行一次
Forward 给定输入计算输出
Backward 计算给定输出的梯度

Blob
blob是4D数组，用来存储和交互信息
数据、导数、参数
分配内存
在cpu和gpu之间交互

数据：数量＊K通道＊高度＊宽度
比如ImageNet的训练数据：256 x 3 x 227 x 227
参数：卷积权重
N输出＊K输入＊高度＊宽度
比如CaffeNet conv1：96 x 3 x 11 x 11
参数：卷积偏置
比如CaffeNet conv1：96 x 1 x 1 x 1

blob接口：
Reshape(num, channel, height, width)

Solving: 训练网络

train_net: "lenet_train.prototxt" 指定网络模型
base_lr: 0.01 初始学习速率
momentum: 0.9 动量，应该是上一批训练数据的梯度保留的比例
weight_decay: 0.0005 衰减速度
max_iter: 10000 最大迭代次数
snapshot_prefix: "lenet_snapshot" 训练到达一定迭代次数，临时保存一个模型
solver_mode: GPU 指定CPU或者GPU

训练方式：
Stochastic Gradient Descent (SGD) + momentum
Adaptive Gradient (ADAGRAD)
Nesterov’s Accelerated Gradient (NAG)

Loss层
指定一个loss计算函数
分类：
SOFTMAX_LOSS
HINGE_LOSS
线性回归
EUCLIDEAN_LOSS
多分类
SIGMOID_CROSS_ENTROPY_LOSS

默认loss权值是1

ccemmawatson

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
caffe脚本

Net网络就是由层组合成的name: "dummy-net"layers { name: "data" ...}layers { name: "conv" ...}layers { name: "pool" ...}LogReg ↑... more layers ...layers { name: "loss" ...}初始化网络的时候会检查合法性数
复制链接

扫一扫

专栏目录