利用caffe工具生成lmdb数据文件

参考博客

caffe 中将图片转化为lmdb

affe对于训练数据格式,支持:lmdb、h5py……,其中lmdb数据格式常用于单标签数据,像分类等,经常使用lmdb的数据格式。对于回归等问题,或者多标签数据,一般使用h5py数据的格式。当然好像还有其它格式的数据可用,本文就主要针对lmdb数据格式的制作方法,进行简单讲解。

以一个简单的例子来介绍一下如何生成自己的图像集。主要分为两步:
(1)生成标签文件列表,即生成 .txt 文件
(2)将 txt 文件列表中的图像与train图像库、val图像库的图像相连接,生成lmdb格式文件
lmdb数据

lmdb用于单标签数据。为了简单起见,我后面通过一个性别分类作为例子,进行相关数据制作讲解。

1、数据准备

首先我们要准备好训练数据,然后新建一个名为train的文件夹和一个val的文件夹:

train文件存放训练数据,val文件存放验证数据。然后我们在train文件下面,把训练数据猫、狗图片各放在一个文件夹下面:



同样的我们在val文件下面也创建文件夹:



两个文件也是分别存我们用于验证的图片数据猫与狗图像文件。我们在test_cat下面存放了都是猫的图片,然后在test_dog下面存放的都是验证数据的狗图片。

将train 与 val 文件夹放到一个文件夹内,本文中放到了Data_Test文件夹内。

2、标签文件.txt文件制作.

接着我们需要制作一个train.txt、val.txt文件,这两个文件分别包含了我们上面的训练数据的图片路径,以及其对应的标签,如下所示。


我们把猫图片标号为1,狗图片标记为0。标签数据文件txt的生成可以通过如下代码,通过扫描路径猫、狗下面的图片,得到标签文件train.txt和val.txt:

需要注意的是路径与标签之间是一个空格标签最好从0开始。

    <pre class="python" name="code">#coding:utf-8  
    ''''' 
    Created on Jul 29, 2016 
     
    @author: sgg 
    '''  
      
    "<span style=""font-family:Arial;font-size:18px;"">"  
    "<span style=""font-size:18px;"">"  
    "<span style=""font-size:18px;"">"   
    import os  
      
    def IsSubString(SubStrList,Str):  
        flag=True  
        for substr in SubStrList:  
            if not(substr in Str):  
                flag=False  
          
        return flag  
      
    #扫面文件  
    def GetFileList(FindPath,FlagStr=[]):  
        FileList=[]  
        FileNames=os.listdir(FindPath)  
        if len(FileNames)>0:  
            for fn in FileNames:  
                if len(FlagStr)>0:  
                    if IsSubString(FlagStr,fn):  
                        fullfilename=os.path.join(FindPath,fn)  
                        FileList.append(fullfilename)  
                else:  
                    fullfilename=os.path.join(FindPath,fn)  
                    FileList.append(fullfilename)  
          
        if len(FileList)>0:  
            FileList.sort()  
              
        return FileList  
      
      
      
    train_txt=open('train.txt','w')  
    #制作标签数据,如果是狗的,标签设置为0,如果是猫的标签为1  
    imgfile=GetFileList('train/train_cat')#将数据集放在与.py文件相同目录下  
    for img in imgfile:  
        str1=img+' '+'1'+'\n'        #用空格代替转义字符 \t   
        train_txt.writelines(str1)  
          
      
    imgfile=GetFileList('train/train_dog')  
    for img in imgfile:  
        str2=img+' '+'0'+'\n'  
        train_txt.writelines(str2)  
    train_txt.close()  
      
      
    #测试集文件列表  
    test_txt=open('val.txt','w')  
    #制作标签数据,如果是男的,标签设置为0,如果是女的标签为1  
    imgfile=GetFileList('val/test_cat')#将数据集放在与.py文件相同目录下  
    for img in imgfile:  
        str3=img+' '+'1'+'\n'  
        test_txt.writelines(str3)  
          
      
    imgfile=GetFileList('val/test_dog')  
    for img in imgfile:  
        str4=img+' '+'0'+'\n'  
        test_txt.writelines(str4)  
    test_txt.close()  
      
    print("成功生成文件列表")  

将上述代码保存为.py的Python文件,运行该Python代码生成 txt 文件。

:本文中生成txt文件时,Data_Test文件夹与生成文件列表的代码.py文件位于同一个目录下。3、生成lmdb数据

接着我们的目的就是要通过上面的四个文件(两个txt文件列表、train与val两个图库),把图片的数据和其对应的标签打包起来,打包成lmdb数据格式:在caffe-master创建My_Files文件夹,然后将caffe-master下的imagenet文件夹的create_imagenet.sh复制到该文件夹下进行修改,进行训练和测试路径的设置,运行该sh.

注意:这里是对.sh文件进行修改,在终端打开该文件后进行修改并保存。这里为了排版所以代码类型选择了Python代码类型。

tools路径问题

    <pre class="python" name="code">#!/usr/bin/env sh  
    # Create the imagenet lmdb inputs  
    # N.B. set the path to the imagenet train + val data dirs  
    set -e  
      
      
    EXAMPLE=My_Files/Build_lmdb      #生成模型训练数据文件夹,即create_imagenet.sh所在文件夹  
    DATA=My_Files/Data_Test             #python脚本处理数据路径,即生成的文件列表.txt文件所在文件夹  
    TOOLS=build/tools              #caffe的工具库,不用更改.sh所在文件要和tools平行,
                                    #根目录使用时仍出现not found问题
      
    TRAIN_DATA_ROOT=/home/sgg/workspace/caffe_learn/scr/Data_Test/     #待处理的训练数据  
    VAL_DATA_ROOT=/home/sgg/workspace/caffe_learn/scr/Data_Test/  #待处理的验证数据  
      
      
    # Set RESIZE=true to resize the images to 256x256. Leave as false if images have  
    # already been resized using another tool.  
    RESIZE=true  #是否需要对图片进行resize  
    if $RESIZE; then  
      RESIZE_HEIGHT=256  
      RESIZE_WIDTH=256  
    else  
      RESIZE_HEIGHT=0  
      RESIZE_WIDTH=0  
    fi  
      
    if [ ! -d "$TRAIN_DATA_ROOT" ]; then  
      echo "Error: TRAIN_DATA_ROOT is not a path to a directory: $TRAIN_DATA_ROOT"  
      echo "Set the TRAIN_DATA_ROOT variable in create_imagenet.sh to the path" \  
           "where the ImageNet training data is stored."  
      exit 1  
    fi  
      
    if [ ! -d "$VAL_DATA_ROOT" ]; then  
      echo "Error: VAL_DATA_ROOT is not a path to a directory: $VAL_DATA_ROOT"  
      echo "Set the VAL_DATA_ROOT variable in create_imagenet.sh to the path" \  
           "where the ImageNet validation data is stored."  
      exit 1  
    fi  
      
    echo "Creating train lmdb..."  
      
    rm -rf $EXAMPLE/train_lmdb  
    rm -rf $EXAMPLE/val_lmdb    #删除已存在的lmdb格式文件,若在已存在lmdb格式的文件夹下再添加lmdb文件,
                                #会出现错误。(原始程序没有这两行)  
      
    GLOG_logtostderr=1 $TOOLS/convert_imageset \  
        --resize_height=$RESIZE_HEIGHT \  
        --resize_width=$RESIZE_WIDTH \  
        --shuffle \  
        $TRAIN_DATA_ROOT \  
        $DATA/train.txt \  
        $EXAMPLE/train_lmdb  
          
      
    echo "Creating val lmdb..."  
      
    GLOG_logtostderr=1 $TOOLS/convert_imageset \  
        --resize_height=$RESIZE_HEIGHT \  
        --resize_width=$RESIZE_WIDTH \  
        --shuffle \  
        $VAL_DATA_ROOT \  
        $DATA/val.txt \  
        $EXAMPLE/val_lmdb  
         
    echo "Done."  

修改tools路径之后可以运行


这里对程序中所涉及的几个路径做简单说明:

先通过几张图了解一下每个文件夹所包含的内容与位置:1、训练与测试图像库,即 train 与 val 文件夹所在位置,可以通过查看属性来确定其位置,本文中其位置是位于/home/sgg/workspace/caffe_learn/scr/Data_Test  2、生成的txt文件,即 train.txt 与 test.txt 文件所在位置,可以通过查看属性来确定其位置,本文中其位置是位于/home/sgg/Downloads/caffe-master/My_Files/Data_Test

3、生成lmdb的.sh文件,即 进行修改后的create_imagenet.sh文件所在位置,可以通过查看属性来确定其位置,本文中其位置是位于/home/sgg/Downloads/caffe-master/My_Files/Build_lmdb

4、生成后的lmdb格式文件,即 生成的train_lmdb与val_lmdb文件夹所在位置,其位置与生成文件create_imagenet.sh位于同一目录下,本文中其位置是位于/home/sgg/Downloads/caffe-master/My_Files/Build_lmdb


正式介绍文件中的几个路径值

1、EXAMPLE

EXAMPLE 表示生成模型训练数据文件夹,即create_imagenet.sh所在文件夹

本文设为EXAMPLE=My_Files/Build_lmdb     ,其中My_Files文件夹位于caffe-master文件夹下

2、DATA

DATA 表示python脚本处理数据路径,即生成的文件列表.txt文件所在文件夹

本文设为 DATA=My_Files/Data_Test            

注:1)本文开始为了测试DATA 值的设定,在该目录下直接拷贝了eclipse工作空间下的Data_Test文件,所以这里要注意这里是含有Data_Test文件夹的。

(2)该DATA路径直接写为 My_Files/Data_Test   ,不用将其变为 /home/sgg/Downloads/caffe-master/My_Files/Data_Test ,写成这样是错误的。具体原因尚不明确。

3、TOOLS

TOOLS  表示caffe的工具库,为  TOOLS=build/tools   不用更改

4、TRAIN_DATA_ROOT

TRAIN_DATA_ROOT 表示待处理的训练数据,即 train 训练图像库所在位置。

注:

(1)这里需要写具体地址,这就是为什么看地址时需要通过文件的属性进行查看具体地址,写的地址为属性中所显示的地址。

像本文train 训练图像库所在位置为  /home/sgg/workspace/caffe_learn/scr/Data_Test/train/   ,我们经常在终端定位时写的比较简单,在终端定位时的地址为: /workspace/caffe_learn/scr/Data_Test/train/   ,会直接省略 /home/sgg ,但如果在程序中省略的话是出错误的,所以这里的地址要是完整地址。

(2)由于我们在生成txt 文件时路径中包含了 “train” 与" val ",所以在 .sh 文件中写路径时去掉了train,将其路径定义为 /home/sgg/workspace/caffe_learn/scr/Data_Test/  ,TRAIN_DATA_ROOT所设定的值与 txt 文件中路径两者合起来是图像的整体路径。

5、VAL_DATA_ROOT

VAL_DATA_ROOT 表示待处理的验证数据,即 val 训练图像库所在位置,其要求与TRAIN_DATA_ROOT 相同。


4、验证生成的lmdb数据

通过运行上面的脚本,我们将得到文件夹train_lmdb\val_lmdb:


我们打开train_lmdb文件夹

并查看一下文件data.mdb数据的大小,如果这个数据包好了我们所有的训练图片数据,查一下这个文件的大小是否符合预期大小,如果文件的大小才几k而已,那么就代表你没有打包成功,估计是因为路径设置错误。


在生成过程中遇到了如下问题:

1、如果文件夹下含有lmdb格式的文件,那么生成时会出现错误,所以在生成之前需要对create_imagenet.sh 所在文件夹进行检查,删除之前的 lmdb 文件。代码中添加了代码,来辅助完成此检查:

[python] view plain copy
 在CODE上查看代码片派生到我的代码片

    rm -rf $EXAMPLE/train_lmdb  
    rm -rf $EXAMPLE/val_lmdb    #删除已存在的lmdb格式文件,若在已存在lmdb格式的文件夹下再添加lmdb文件,会出现错误  

2、在生成lmdb过程中,出现   can not find or open  …//.......jpg  这个错误时 这个错误中会给出相应的图像路径:

首先,查看路径是否正确,若路径不正确,则需要更改相应的图像路径。再运行,看问题是否解决。

若问题还没有解决,则检查train.txt中,路径和标签之间是否只有一个空格!

在一些程序中,在对图像加标签时,标签与路径之间的空格使用转义字符 “  \t  ”来生成,可是在生成txt中,路径与标签之间的距离往往多于一个空格,所以在生成标签文档时,程序中用空格代替转义字符 \t  。如下方程序所示:

[python] view plain copy
 在CODE上查看代码片派生到我的代码片

    str1=img+' '+'1'+'\n'  






  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Caffe是一个深度学习框架,其配置文件包含了网络结构、数据输入格式、训练参数等内容。下面是一个简单的配置文件示例: ``` name: "MyNetwork" # 网络名称 layer { name: "input" # 输入层名称 type: "Data" # 层类型 top: "data" # 输出名称 include { phase: TRAIN # 训练阶段 } transform_param { crop_size: 227 # 裁剪大小 mean_value: 104 # 均值 mean_value: 117 mean_value: 123 } data_param { source: "train_lmdb" # 数据源 batch_size: 64 # 批量大小 backend: LMDB # 数据库类型 } } layer { name: "conv1" # 卷积层名称 type: "Convolution" # 层类型 bottom: "data" # 输入名称 top: "conv1" # 输出名称 convolution_param { num_output: 96 # 输出通道数 kernel_size: 11 # 卷积核大小 stride: 4 # 步长 weight_filler { type: "xavier" # 权重初始化方法 } bias_filler { type: "constant" # 偏置初始化方法 value: 0 # 偏置值 } } } ``` 配置文件中,每个层都由一个`layer`标签表示,其中包含了该层的名称、类型、输入输出名称、参数配置等信息。例如,第一个层为`Data`类型,包含了数据的输入格式、数据源、批量大小等信息。第二个层为`Convolution`类型,包含了卷积核大小、步长、输出通道数、权重初始化方法、偏置初始化方法等信息。 除了网络结构和数据输入格式,配置文件还包含了训练参数,例如学习率、权重衰减、优化器类型等。这些参数可以在`solver`标签中进行配置。例如: ``` net: "my_network.prototxt" # 网络配置文件路径 test_iter: 100 # 测试迭代次数 test_interval: 500 # 测试间隔 base_lr: 0.01 # 初始学习率 lr_policy: "step" # 学习率衰减策略 gamma: 0.1 # 学习率衰减因子 stepsize: 100000 # 学习率衰减间隔 momentum: 0.9 # 动量 weight_decay: 0.0005 # 权重衰减 solver_mode: GPU # 训练模式 ``` 以上是Caffe配置文件的简单介绍,实际使用中还需要根据具体情况进行配置。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值