使用caffe中的imagenet对自己的图片进行分类训练(超级详细版)

最新推荐文章于 2025-10-09 15:46:49 发布

原创

最新推荐文章于 2025-10-09 15:46:49 发布 · 3.4w 阅读

37 ·

CC 4.0 BY-SA版权

文章标签：

#caffe #imagenet

本文详细记录了使用Caffe框架在Linux环境下，利用自己的图片集训练ImageNet模型的过程，包括环境配置、数据集准备、计算图像均值、设置网络参数及运行训练脚本等步骤。

因为自己在网络上查到的资料对于一个新手来说虽然指明了方向，但是在细节上没有给出很好的实例，因此我把自己训练的过程记录下来。

【实验环境】

物理内存：64G Free：7.5G CPU个数：3，单个CPU物理核数：8

操作系统：Linux

备注：具有GPU运算能力

【实验目标】

使用自己的图片集，以及caffe框架，对imagenet进行训练，得到自己的model。

【前期准备】

1. 安装并配置caffe环境

【实验过程】

1. 数据集准备

获取训练图片集与验证图片集，并产生train.txt与val.txt，内容为图片路径与分类标签；将图片进行大小重设，设置为256*256大小；使用create_imagenet.sh脚本将2组图片集转换为lmbp格式。

2. 计算图像均值

使用make_imagenet_mean.sh计算图像均值，产生imagenet_mean.binaryproto文件。

3. 设置网络参数

拷贝caffe-master/model/bvlc_reference_caffenet中的文件，修改train_val.prototxt，solver.prototxt中的运行参数，并进行路径的修改；拷贝caffe_master/examples/imagenet中的train_caffnet.sh文件，对路径进行修改。

4. 运行train_caffnet.sh

【实验过程详细版】

备注一下目录的情况，这样比较调理啦：

Caffe根目录：caffe_root=/home/james/caffe/

图片类数据：caffe_root/data/mydata

命令参数类数据：caffe_root/examples/mytask

注：默认我们手动添加的除图片以及.txt之外的文件都属于命令参数类数据，运行的时候注意路径就好，另外，我门在实验的时候换了别人的电脑，因此存在caffe根路径前后不一致的状况，大家注意一下就好。

1. 数据集准备

a. 准备训练图片集以及验证图片集

新建caffe_root/data/mydata，分别将图片集放置于caffe_root/data/mydata/train与caffe_root/data/mydata/val下面

b. 准备图片清单

在caffe_root/data/mydata下面新建两个文件train.txt与val.txt，train.txt中的内容为：

1.jpg 7

2.jpg7

3.jpg 7

…

以上格式为图片名称+空格+类标（数字）的格式，val.txt的格式也是一样的（同样需要类标）。

此步可以使用create_filelist.sh进行批量添加图片路径至train.txt。create_filelist.sh内容需要按照自身图片的名称与类标情况进行修改，并持续运行（因为是在文件后面追加）内容如下：

#!/usr/bin/env sh

#!/bin/bash

DATA=/home/james/caffe/data/mydata/val

MY=/home/james/caffe/data/mydata

for i in {3122..3221}

echo $i.jpg 3 >> $MY/val.txt

done

echo "All done"

以上命令意思是，在val文件夹下面的图片中，名称为3122.jpg至3221.jpg的图片都是第3类，因此就会在val.txt写入：

3122.jpg 3

3123.jpg 3

…

注意：此时可能会报出bad loop variable的错误，这是由于Ubuntu bash的版本的原因，可以自行查看如何解决。

c. 调整图片大小至256*256

因为之前没有仔细看caffe的相关文件，后来才知道可以使用之自动调整大小，因此此步采用的是自己调用命令进行调整大小。如果不调整图片大小的话，在运行后面命令的时候是会报错的。

可以使用convert256.sh进行转换。注意，该命令中用到了imagemagick工具，因此如果自己没有安装的话，还需要安装该工具（命令为：sudo apt-get install imagemagick）。convert256.sh内容如下：

for name in/home/james/caffe/data/mydata/train/*.jpg; do

convert -resize 256x256\! $name $name

done

d. 构建图片数据库

要让Caffe进行图片的训练，必须有图片数据库，并且也是使用其作为输入，而非直接使用图片作为输入。使用create_imagenet.sh脚本将train与val的2组图片集转换为lmbp格式。create_imagenet.sh内容如下：

#!/usr/bin/env sh

# Create the imagenet lmdb inputs

# N.B. set the path to the imagenet train +val data dirs

EXAMPLE=/home/james/caffe/examples/mytask

DATA=/home/james/caffe/data/mydata

TOOLS=/home/james/caffe/build/tools

TRAIN_DATA_ROOT=/home/james/caffe/data/mydata/train/

VAL_DATA_ROOT=/home/james/caffe/data/mydata/val/

# Set RESIZE=true to resize the images to256x256. Leave as false if images have

# already been resized using another tool.

RESIZE=false

if $RESIZE; then

RESIZE_HEIGHT=256

RESIZE_WIDTH=256

else

RESIZE_HEIGHT=0

RESIZE_WIDTH=0

if [ ! -d "$TRAIN_DATA_R

最低0.47元/天解锁文章

6 条评论

qq_26515885 2017.12.28
我想问问，如果要要用ImageNet对自己的图片进行分类，打标签，是不是必须要自己先建立训练集，要人工做一些标记，还是不需要？菜鸟的问题，希望大家帮我解答一下，谢谢。
- 刀光剑影闯荡江湖回复qq_26515885 2019.02.08
  [reply]qq_26515885[/reply] 是的，需要标记 :)

探索空间 2017.12.19
先收藏一下
- 刀光剑影闯荡江湖回复探索空间 2019.02.08
  [reply]tansuo17[/reply] ok :)

michaelscofielddong 2017.10.24
为什么都不用Digits....
- 刀光剑影闯荡江湖回复michaelscofielddong 2019.02.08
  [reply]michaelscofielddong[/reply] 因为那个时候一队友的选择。。。:) 谢谢你的建议

十八子林 2017.10.14
博主，你好。请问生成lmdb格式的乱序是打乱一次顺序吗？将数据集送入网络训练，如何对每一轮迭代进行乱序？
- 十八子林回复刀光剑影闯荡江湖 2019.05.06
  [reply]u011244794[/reply] 好的，谢谢
- 刀光剑影闯荡江湖回复十八子林 2019.02.08
  [reply]qq_37315513[/reply] 不好意思，目前无法回复您的这个问题。

大数据与计算机视觉 2017.03.28
在train_val.prototxt中，为什么不把输出的1000个类改呢？比如我要分类6个类，应该fc8层的num_output改为6吧？
- 刀光剑影闯荡江湖回复大数据与计算机视觉 2019.02.08
  [reply]daska110[/reply] 您好，可以尝试一下，谢谢:)

w20ss08 2016.08.30
./examples/mytask/create_imagenet: 99: ./examples/mytask/create_imagenet: --resize_height=0: not found ./examples/mytask/create_imagenet: 101: ./examples/mytask/create_imagenet: --resize_width=0: not found ./examples/mytask/create_imagenet: 103: ./examples/mytask/create_imagenet: --shuffle: not found ./examples/mytask/create_imagenet: 105: ./examples/mytask/create_imagenet: /home/wss/caffe/data/mydata/val/: Permission denied ./examples/mytask/create_imagenet: 107: ./examples/mytask/create_imagenet: /home/wss/caffe/data/mydata/val.txt: Permission denied ./examples/mytask/create_imagenet: 109: ./examples/mytask/create_imagenet: /home/wss/caffe/examples/mytask/ilsvrc12_val_lmdb: Permission denied 博主，每次都出现这个问题，我改了权限之后，就出现train.txt 中每个bmp图片not found问题，我搞了一下午，也没有解决，求博主指点迷津
- 刀光剑影闯荡江湖回复w20ss08 2016.09.01
  [reply]u012726878[/reply] 你先拿一张.jpg结尾的图片试一下看看.
- 刀光剑影闯荡江湖回复w20ss08 2016.09.01
  [reply]u012726878[/reply] 注意路径啊,我认为是路径找错了,仔细对比一下吧.