制作caffe所需要的数据集

最新推荐文章于 2024-09-23 17:23:39 发布

xiaoyang19910623

最新推荐文章于 2024-09-23 17:23:39 发布

阅读量2.7k

点赞数

分类专栏： Deep Learning 文章标签： caffe 数据集制作 lmdb

本文链接：https://blog.csdn.net/xiaoyang19910623/article/details/53420433

版权

Deep Learning 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

一.最简单的方法，如果安装好了digits，则直接可以使用digits来制作。
二.则是自己制作，制作步骤如下：
1.收集数据，以mnist数据集为例，下面有两个文件夹，分别为train和val;
这里写图片描述
train和val分别有10类数据

2.使用脚本制作label;
应该注意，这两个txt文件具体应该怎么填写，要和train、val文件夹里是怎么放图像的一一对应起来。实际上train.txt与val.txt存放的正是各幅图像的“相对路径+label”。

import os.path
import glob
path = "pics/mnist/train"  #此处为数据集（train和val）的绝对路径
labellist = os.listdir(path)
for label in labellist:
    newpath = os.path.join(path, label)
    # print newpath, label
    for root, dirs, files in os.walk(newpath):
        for file in files:
            print root, file
            f = open(os.path.join(path, "train.txt"), "a")
            f.write(os.path.join(label, file) + " " + label + "\n")

脚本制作完成后，会出现如下两个文件，train.txt与val.txt。
这里写图片描述
train.txt部分截图如下所示：

3.制作lmdb文件;
例用CAFFE_ROOT\examples\imagenet下的create_imagenet.sh脚本。然后对里面的路径进行设定。

完成路径设定之后，运行该sh文件，即可在pic/mnist文件夹下生成imagenet_train_lmdb与 imagenet_val_lmdb文件夹。
这里写图片描述
至此，caffe需要的数据集就制作好了。