深度学习Caffe实战笔记（3）用AlexNet跑自己的数据

最新推荐文章于 2024-08-18 11:12:27 发布

蒲衣翁

最新推荐文章于 2024-08-18 11:12:27 发布

阅读量1.5w

点赞数 20

分类专栏： caffe-深度学习文章标签：深度学习网络 caffe-alex

本文链接：https://blog.csdn.net/gybheroin/article/details/54095399

版权

本文介绍了如何在Windows环境下使用Caffe框架，通过AlexNet模型训练自己的数据集。详细步骤包括数据准备、数据转换、计算均值、训练过程以及测试。博主分享了创建数据标签、转换数据成Caffe所需格式、计算均值文件、编写训练脚本及测试脚本的过程，强调了不同网络训练的通用性。

摘要由CSDN通过智能技术生成

上一篇博客介绍了如何在caffe框架平台下，用LeNet网络训练车牌识别数据，今天介绍用AlexNet跑自己的数据，同样基于windows平台下，会比基于Ubuntu平台下麻烦一些，特别是后面的Siamese网络，说起Siamese网络真是一把辛酸一把泪啊，先让我哭一会，，，，，哭了5分钟，算了，Siamese网络的苦水等以后再倒吧，言归正传，开始train。
在caffe平台下，实现用Alexnet跑自己的数据步骤和上一篇的步骤差不多，可以说几乎一样。。。。。
1、准备数据
在caffe根目录下data文件夹新建一个文件夹，名字自己起一个就行了，我起的名字是cloth，在cloth文件夹下新建两个文件夹，分别存放train和val数据，在train文件夹下存放要分类的数据，要分几类就建立几个文件夹，分别把对应的图像放进去。（当然，也可以把所有的图像都放在一个文件夹下，只是在标签文件中标明就行）。
这里写图片描述

然后建立train数据集对应的标签txt文件。同样，在val文件夹下存放验证数据，并建立验证图像对应的txt标签文件。

2、转换数据
编译成功的caffe根目录下bin文件夹下有一个convert_imageset.exe文件，用来转换数据，在cloth文件夹下新建一个脚本文件，内容：
这里写图片描述
mtrainldb和mvalldb分别是转化好的数据集文件，既caffe需要的文件。这样在cloth文件夹下会生成两个文件夹：

这里面存储的就是生成的数据文件。
3、计算均值
在cloth文件夹下新建一个计算均值的脚本文件，内容如下：
这里写图片描述
用到的computer_image_mean也是bin目录下生成的一个可执行文件，用来计算均值，mtrainldb是存放训练数据的文件夹，mimg_mean_binaryproto就是要生成的均值文件。双击运行后会生成mimg_mean_binaryproto文件，这个文件就是计算出来的均值文件。
4、开始训练
同样，在cloth文件夹下，新建一个train脚本文件，文件内容如下：
这里写图片描述

这个就不过多解释了吧，solver就是Alexnet的超参文件，打开后如下：

net: "train_val.prototxt"   #需要用哪个网络训练
test_iter: 1000             
test_interval: 1000
base_lr: 0.01              #初始化学习率
lr_policy: "step"          #学习策略，每stepsize之后，将学习率乘以gamma
gamma: 0.1   #学习率变化因子
stepsize: 100000  #每stpesize之后降低学习率
display: 20
max_iter: 450000  #最大迭代次数
momentum: 0.9    #动量，上次参数更新的权重
weight_decay: 0.0005   #权重衰减量
snapshot: 10000    #每10000次保存一次模型结果
snapshot_prefix: "cloth"  #模型保存路径
solver_mode: GPU   #CPU或者GPU训练，这里使用CPU，所以需要把GPU改成CPU

打开train_val.prototxt，内容如下：

name: "AlexNet"
layer {
  name: "data"
  type: "Data"
  top: "data"
  top: "label"
  include {
    phase: TRAIN
  }
  transform_param {
    mirror: true
    crop_size: 227
    mean_file: "mimg_mean.binaryproto" #均值文件
  }
  data_param {
    source: "mtrainldb"  #训练数据
    batch_size: 256
    backend: LMDB
  }
}
layer {
  name: "data"
  type: "Data"
  top: "data"
  top: "label"
  include {
    phase: TEST
  }
  transform_param {
    mirror: false
    crop_size: 227
    mean_file: "mimg_mean.binaryproto"  #均值文件
  }
  data_param {
    source: "mvaldb"   #验证数据
    batch_size: 50
    backend: LMDB
  }
}
layer {
  name: "conv1"
  type: "Convolution"
  bottom: "data"
  top: "conv1"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  convolution_param {
    num_output: 96
    kernel_size: 11
    stride: 4
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
      value: 0
    }
  }
}
layer {
  name: "relu1"
  type: "