caffe各层参数详解

最新推荐文章于 2019-10-23 16:07:01 发布

薛离子

最新推荐文章于 2019-10-23 16:07:01 发布

阅读量1.6k

点赞数

分类专栏：深度学习文章标签：深度学习网络 caffe 训练参数训练模型

本文链接：https://blog.csdn.net/teffi/article/details/78798513

版权

深度学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

caffe各层参数详解

根据最近看到的资料，总结下深度学习中常见的模型层。在实际训练网络模型时，多模型融合是一个不错的选择，也就是基于常见的模型层进行组合，微调模型参数，以达到实际的要求。

数据层

{
  name: "data"
  type: "Data"
  top: "data"
  top: "label"
  transparam {
    scale: 0.003920625        // 归一化：1/256
  }
  include {
    phase: TRAIN/TEST         // 训练阶段
  }
  data_param {
    source: "examples/mnist/train_lmdb"
    batch_size: 64           // 批量处理数
    backend: LMDB            // 数据格式，LMDB/HDF5等
  }
}

卷积层

卷积层是CNN网络的核心，一般用来提取图像特征。

layer {
  name: "conv"
  type: "Convolution"
  bottom: "data"
  top: "conv"
  param {
    lr_mult: 1             // weight的学习率
    decay_mult: 1          // 权重衰减
  }
  param {
    lr_mult: 2            // bias的学习率
    decay_mult: 0
  }
  convolution_param {
    num_output: 20        // 通道数
    kernel_size: 5        // 卷积核大小
    stride: 1             // 步长
    weight_filter {       // 权重初始化，xavier/guassion/constant
      type: "xavier"      // 一种均匀化分布
    }
    bias_filter {         // 偏置初始化
      type: "constant"    // 值全为0
    }
  }
}

Pool层

池化层，用来减小训练参数规模。

layer {
  name: "pool"
  type: "Pooling"
  bottom: "conv"
  top: "pool"
  pooling_param {
    pool: MAX             // 最大化，还有均值化/最小化
    kernel_size: 2        // 卷积核大小，缩放效果
    stride: 2             // 步长
  }
}

全连接层

类似卷积层

layer {
  name: "ip"
  type: "InnerProduct"
  bottom: "pool"
  top: "ip"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 10
    weight_filter {
      type: "xavier"
    }
    bias_filter {
      type: "constant"
    }
  }
}

Relu层

激活函数

layer {
  name: "relu"
  type: "Relu"
  bottom: "ip"
  top: "ip"
}

Accuracy层

一般在测试阶段看到训练精度。

layer {
  name: "accuracy"
  type: "Accuracy"
  bottom: "ip"
  bottom: "label"
  top: "accuracy"
  include {
    phase: TEST
  }
}

Softmax层

损失函数，常用于多个分类

layer {
  name: "loss"
  type: "SoftmaxWithLoss"
  bottom: "ip"
  bottom: "label"
  top: "loss"
}

BatchNormal层

批量正则化，不依赖于初始值，加快训练速度。

layer {
  name: "batchnorm"
  type: "BatchNorm"
  bottom: "conv"
  top: "conv"
  batch_norm_param {
    use_global_stats: true
  }
  include {
    phase: TRAIN/TEST
  }
}

Scale层

BN层后面一般都要带Scale层，和batchnorm计算公式中的参数有关。

layer {
  name: "scale"
  type: "Scale"
  bottom: "conv"
  top: "conv"
  scale_param {
    bias_term: true
  }
}

Dropout层

Dropout是一个防止过拟合的trick。可以随机让网络某些隐含层节点的权重不工作。

layer {
  name: "drop7"
  type: "Dropout"
  bottom: "fc7-conv"
  top: "fc7-conv"
  dropout_param {
    dropout_ratio: 0.5
  }
}

薛离子

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录