【caffe-Windows】训练自己数据——数据集格式转换

前言

看了mnist和cifar的实例,是不是想我们现实中一般都是一张张的图片,和实例里面都不一样呢?那么如何来进行训练呢?为了能够简便点,我们就不自己去采集数据集了,因为第一自己采集的数据集量可能不够,第二,采集的数据集可能标注有很大问题,比如噪声太多等,第三针对每一种数据,我相信有不同的模型去进行classification,并不是一味地套用别人的模型,当然也可以在别人基础上做微调fine tuning。

在这一个教程中,我们利用cifar数据集去模拟现实中的训练。

如果你有自己的数据,可直接进行第二步

第一步

cifar数据集的可视化。读者如果有自己数据集,可以忽视此步骤,此步骤主要用于将cifar 的数据全部转为png图片,并制作相应标签。

先看看我的代码的目录结构:


接下来介绍每一个文件的由来:

①test和train文件夹是我用来存储cifar每一张图片的位置,一个是训练集、一个是测试集

②几个mat文件,从cifar的官网去下载matlab version的数据集,解压就可以得到。

③几个.m文件就是我们用来可视化以及图片转存的代码。

下面看这几个程序:

ReadImage.m

[html]  view plain  copy
 print ? 在CODE上查看代码片 派生到我的代码片
  1. function  image  = ReadImage( data )  
  2. %data是一维的,1*3072,转换为32*32*3的图片  
  3. image(:,:,1)=reshape(data(1,1:1024),32,32);  
  4. image(:,:,2)=reshape(data(1,1025:2048),32,32);  
  5. image(:,:,3)=reshape(data(1,2049:3072),32,32);  
  6. end  
read_train.m

[html]  view plain  copy
 print ? 在CODE上查看代码片 派生到我的代码片
  1. %cifar转image,可视化  
  2. %N*3072维度,每1024分别代表RGB,图像大小32*32  
  3. clear  
  4. clc  
  5. load('batches.meta.mat')  
  6. numpic=0;  
  7. fp=fopen('./train/train_labels.txt','wt');  
  8.   
  9. for i=1:5  
  10.     count=0;  
  11.     str=['data_batch_' num2str(i) '.mat'];  
  12.     fprintf('load %s\n',str);  
  13.     load(str)  
  14.     figure(1)  
  15.     set (gcf,'Position',[50,50,900,900], 'color','w')  
  16.     for j=1:size(data,1)  
  17.         %% 读取图片和标签  
  18.         count=count+1;%每次可视化计数subplot位置  
  19.         numpic=numpic+1;%为图片编号从1开始,规则:序号+图片标签(1-cat,2-frog)  
  20.         image=ReadImage(data(j,:));%按顺序读取图片  
  21.         label=label_names{labels(j,1)+1};%读取对应标签名字  
  22.         %% 每读100张显示一次图片  
  23.          subplot(10,10,count)  
  24.          image=uint8(image);  
  25.          imshow(image);  
  26.          title(label)  
  27.         if mod(count,100)==0  
  28.             count=0;  
  29.             pause(0.1)  
  30.         end  
  31.         %% 存储在文件夹train中  
  32.         picture_name=['./train/' num2str(numpic) label '.png'];  
  33.         name=[num2str(numpic) label '.png'];  
  34.         imwrite(image,picture_name,'png')  
  35.         fprintf(fp,'%s %s\n',name,num2str(labels(j,1)));  
  36.     end  
  37. end  
  38. fclose(fp);  

read_test.m

[html]  view plain  copy
 print ? 在CODE上查看代码片 派生到我的代码片
  1. %cifar转image,可视化  
  2. %N*3072维度,每1024分别代表RGB,图像大小32*32  
  3. clear  
  4. clc  
  5. close all  
  6. load('batches.meta.mat')  
  7. numpic=0;  
  8. fp=fopen('./test/test_labels.txt','wt');  
  9. fp1=fopen('./test/test_labels1.txt','wt');  
  10. count=0;  
  11. load test_batch.mat  
  12. figure(1)  
  13. set (gcf,'Position',[50,50,900,900], 'color','w')  
  14. for j=1:size(data,1)  
  15.     %% 读取图片和标签  
  16.     count=count+1;%每次可视化计数subplot位置  
  17.     numpic=numpic+1;%为图片编号从1开始,规则:序号+图片标签(1-cat,2-frog)  
  18.     image=ReadImage(data(j,:));%按顺序读取图片  
  19.     label=label_names{labels(j,1)+1};%读取对应标签  
  20.     %% 每读100张显示一次图片  
  21.     subplot(10,10,count)  
  22.     image=uint8(image);  
  23.     imshow(image);  
  24.     title(label)  
  25.     if mod(count,100)==0  
  26.         count=0;  
  27.         pause(0.1)  
  28.     end  
  29.     %% 存储在文件夹test中  
  30.     picture_name=['./test/' num2str(numpic) label '.png'];  
  31.     name=[num2str(numpic) label '.png'];  
  32.     imwrite(image,picture_name,'png')  
  33.     fprintf(fp,'%s %s\n',name,num2str(labels(j,1)));  
  34.     fprintf(fp1,'%s 0\n',name);  
  35. end  
  36. fclose(fp);  
  37. fclose(fp1);  
分别运动read_train和read_test,可以看到train和test文件夹会逐渐生成数据集,且均为单张图片。

读取完毕以后,在train里面有50000张图片和一个标签txt文件,test里面有10000张图片和两个标签txt,一个是正确标注,一个是全标注为0。

【附cifar的几个文件】

①matlab version的mat文件:链接:http://pan.baidu.com/s/1bUAgf8 密码:wk6t

②读取完毕的train文件夹:链接:http://pan.baidu.com/s/1sl5tqxR 密码:krhn

③读取完毕的test文件夹:链接:http://pan.baidu.com/s/1mhJ0vXI 密码:o69i

好了,至此我们已经得到了现实中经常使用的数据格式。

第二步

以cifar的test集的制作为例吧。

先说一下现实基础:数据集必须分为两个文件夹(一个train,一个test),然后每一个文件夹必须再分文件夹,每一个文件夹代表一类数据。

比如cifar,上面提取的数据分别存储在train和test文件夹,但是并未归类。那么,我在E:\CaffeDev\caffe-master\data\cifar10\cifar-visual\cifar10内新建一个文件夹test,然后在test内部新建了airplane、cat、frog三个文件夹,在每一个文件夹中分别放入了从第一步提取的 test 集中随便取的对应类别的56张图片。

还是看一下目录结构吧




云盘分享可以看出目录结构:链接:http://pan.baidu.com/s/1i5nuKb7 密码:xlr4

接下来就是读取每一张图片,并且添加相应的数据标签到txt里面去了,在E:\CaffeDev\caffe-master\data\cifar10\cifar-visual\cifar10新建了一个test_label.txt,然后使用matlab书写文件写入的代码:

[plain]  view plain  copy
 print ? 在CODE上查看代码片 派生到我的代码片
  1. %读取图片,制作cifar测试集  
  2. fprintf(2,'Reading test data.... \n');  
  3. rt_data_dir = './test_cifar';    %测试集的根目录  
  4. data_dir='test_cifar'; %标签txt中不需要根目录前面的./,所以新建一个变量存储  
  5. subfolders = dir(rt_data_dir); %根目录结构  
  6. totalclass=0;%用于存储有类别数  
  7. fp=fopen('test_label.txt','wt');    
  8. for ii = 1:length(subfolders),  
  9.     subname = subfolders(ii).name;%获取根目录下的所有文件夹名称  
  10.     %有两个隐藏文件夹,用于./和../跳转,读取数据集不需要它俩  
  11.     if ~strcmp(subname, '.') && ~strcmp(subname, '..'),  
  12.         totalclass=totalclass+1;%每一个文件夹都是一个类别  
  13.         label_name{totalclass} = subname; %读取此文件夹的名称,也可以自己建立一个标签集,依次取  
  14.         data = dir(fullfile(rt_data_dir, subname, '*.png'));  %取出所有后缀为png的数据  
  15.         c_num=length(data);%当前类别有多少个数据  
  16.         for jj=1:c_num  
  17.           name=fullfile(data_dir, subname, data(jj).name);  
  18.           fprintf(fp,'%s %s\n',name,num2str(totalclass-1));%从0开始编号  
  19.         end  
  20.         fprintf(1,'正在处理类别:%s\n',label_name{totalclass});  
  21.     end  
  22. end  


主要功能就是完成了当前目录下的test文件夹下每一个类别的全部数据的文件名(比如\test_cifar\airplane\9483airplane.png)读取,并且写入到txt里面。

第三步

转换leveldb格式

主要调用caffe.sln编译完毕得到的convert_imageset.exe这个程序,首先看一下使用说明


按照这个说明,首先是找到exe的路径,然后是数据集文件夹,数据集标签,转换以后的数据存储位置,-backend设置转换格式(leveldb/lmdb)

【注意】如果是你自己的数据集,这个地方的标签一定要注意,读取的时候是按照“数据文件夹/标签内容”依次读取的,不然无法读取成功。比如在下例中,如果你的标签内容第一行为airplane\9483airplane.png,数据集文件夹是test_cifar\ 那么读取的时候就是test_cifar\airplane\9483airplane.png,但是如果标签内容为test_cifar\airplane\9483airplane.png,那么读取的时候就读取test_cifar\test_cifar\airplane\9483airplane.png ,显然读取失败,不存在此文件,因为前面重复了根目录,这个地方一定要注意

转换数据使用的convert.bat内容如下:

[plain]  view plain  copy
 print ? 在CODE上查看代码片 派生到我的代码片
  1. E:\CaffeDev\caffe-master\Build\x64\Debug\convert_imageset.exe  ./test_cifar/ test_label.txt  test_leveldb -backend=leveldb  
  2. pause  

也可以设置一下[FLAGS]重新把所有的图像resize一下,注意caffe的输入数据集必须是统一大小

更新日志2017-1-9

这个地方resize开始写博客的时候写成28*28了,导致caffe -test命令自动终止,而无测试的batch信息,改成32*32的原始大小即可了,这个大小必须和train的数据集的大小相同,不然会导致同一个模型参数,接受了不同尺寸大小的图片输入。

[plain]  view plain  copy
 print ? 在CODE上查看代码片 派生到我的代码片
  1. E:\CaffeDev\caffe-master\Build\x64\Debug\convert_imageset.exe --resize_width=32 --resize_height=32  ./test_cifar/ test_label.txt  test_leveldb -backend=leveldb  
  2. pause  


运行时候内容如下:

[html]  view plain  copy
 print ? 在CODE上查看代码片 派生到我的代码片
  1. E:\CaffeDev\caffe-master\data\cifar10\cifar-visual\cifar10>E:\CaffeDev\caffe-mas  
  2. ter\Build\x64\Debug\convert_imageset.exe  ./test_cifar/ test_label.txt  test_lev  
  3. eldb -backend=leveldb  
  4. I1017 17:25:38.574908 16872 convert_imageset.cpp:86] A total of 168 images.  
  5. I1017 17:25:38.584908 16872 db_leveldb.cpp:18] Opened leveldb test_leveldb  
  6. I1017 17:25:38.768919 16872 convert_imageset.cpp:150] Processed 168 files.  
  7.   
  8. E:\CaffeDev\caffe-master\data\cifar10\cifar-visual\cifar10>pause  
  9. 请按任意键继续. . .  

如果显示的读取图片数量为0,或者图片不存在,那么肯定是文件夹名写错或者是标签问题,确切地说,是标签里面的路径问题,一定要注意这一点。

【注】如果这个步骤你想转换为lmdb格式,只需要修改-backend=lmdb即可。

转换完毕以后可以用已经训练好的模型来测试一下这三类模型(注意区分这时的test虽然取自val,但是作用并非val的作用,而是作为test集的,详细自行查找机器学习三个数据集的作用):链接:http://pan.baidu.com/s/1jHPGMpw 密码:g97n

第四步

总结一下,容易出错的地方在于:

①bat 内部书写出问题,严格按照第三步的几个顺序书写

②标签txt 内部的路径问题,很可能与bat 所书写的根路径重复

训练模型回看前面的

【caffe-Windows】cifar实例编译之model的生成:http://blog.csdn.net/zb1165048017/article/details/51476516



原文链接:http://blog.csdn.net/zb1165048017/article/details/52447567

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值