caffe各层参数详解

caffe各层参数详解

根据最近看到的资料,总结下深度学习中常见的模型层。在实际训练网络模型时,多模型融合是一个不错的选择,也就是基于常见的模型层进行组合,微调模型参数,以达到实际的要求。

数据层
{
  name: "data"
  type: "Data"
  top: "data"
  top: "label"
  transparam {
    scale: 0.003920625        // 归一化:1/256
  }
  include {
    phase: TRAIN/TEST         // 训练阶段
  }
  data_param {
    source: "examples/mnist/train_lmdb"
    batch_size: 64           // 批量处理数
    backend: LMDB            // 数据格式,LMDB/HDF5等
  }
}
卷积层

卷积层是CNN网络的核心,一般用来提取图像特征。

layer {
  name: "conv"
  type: "Convolution"
  bottom: "data"
  top: "conv"
  param {
    lr_mult: 1             // weight的学习率
    decay_mult: 1          // 权重衰减
  }
  param {
    lr_mult: 2            // bias的学习率
    decay_mult: 0
  }
  convolution_param {
    num_output: 20        // 通道数
    kernel_size: 5        // 卷积核大小
    stride: 1             // 步长
    weight_filter {       // 权重初始化,xavier/guassion/constant
      type: "xavier"      // 一种均匀化分布
    }
    bias_filter {         // 偏置初始化
      type: "constant"    // 值全为0
    }
  }
}
Pool层

池化层,用来减小训练参数规模。

layer {
  name: "pool"
  type: "Pooling"
  bottom: "conv"
  top: "pool"
  pooling_param {
    pool: MAX             // 最大化,还有均值化/最小化
    kernel_size: 2        // 卷积核大小,缩放效果
    stride: 2             // 步长
  }
}
全连接层

类似卷积层

layer {
  name: "ip"
  type: "InnerProduct"
  bottom: "pool"
  top: "ip"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 10
    weight_filter {
      type: "xavier"
    }
    bias_filter {
      type: "constant"
    }
  }
}
Relu层

激活函数

layer {
  name: "relu"
  type: "Relu"
  bottom: "ip"
  top: "ip"
}
Accuracy层

一般在测试阶段看到训练精度。

layer {
  name: "accuracy"
  type: "Accuracy"
  bottom: "ip"
  bottom: "label"
  top: "accuracy"
  include {
    phase: TEST
  }
}
Softmax层

损失函数,常用于多个分类

layer {
  name: "loss"
  type: "SoftmaxWithLoss"
  bottom: "ip"
  bottom: "label"
  top: "loss"
}
BatchNormal层

批量正则化,不依赖于初始值,加快训练速度。

layer {
  name: "batchnorm"
  type: "BatchNorm"
  bottom: "conv"
  top: "conv"
  batch_norm_param {
    use_global_stats: true
  }
  include {
    phase: TRAIN/TEST
  }
}
Scale层

BN层后面一般都要带Scale层,和batchnorm计算公式中的参数有关。

layer {
  name: "scale"
  type: "Scale"
  bottom: "conv"
  top: "conv"
  scale_param {
    bias_term: true
  }
}
Dropout层

Dropout是一个防止过拟合的trick。可以随机让网络某些隐含层节点的权重不工作。

layer {
  name: "drop7"
  type: "Dropout"
  bottom: "fc7-conv"
  top: "fc7-conv"
  dropout_param {
    dropout_ratio: 0.5
  }
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值