Tensorflow 用自己图片制作数据集仿cifar10（二）

最新推荐文章于 2024-07-26 00:47:19 发布

Inc_Cool

最新推荐文章于 2024-07-26 00:47:19 发布

阅读量7.2k

点赞数 1

分类专栏： Tensorflow 文章标签： Tensorflow cifar10 图片数据 bin

Tensorflow 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

本系列文章由 @yhl_leo 出品，转载请注明出处。
文章链接： http://blog.csdn.net/yhl_leo/article/details/50801226

前一篇博客：C/C++ 图像二进制存储与读取中，已经讲解了如何利用C/C++的方法存储与读取二进制图像文件，本文继续讲述如何根据CIFAR-10的格式制作自己的数据集。

所述博文与代码均已同步至GitHub：yhlleo/imageBinaryDataset

主要代码文件有三个：

BinaryDataset.h
BinaryDataset.cpp
main.cpp

以main.cpp给出的一个小demo为例，首先指定一个原数据图片所在的文件夹：

</pre><p style="margin-top:0px; margin-bottom:1.1em; padding-top:0px; padding-bottom:0px; color:rgb(85,85,85); font-family:"microsoft yahei"; font-size:14px">然后，自动获得该文件下的所有图片文件名：</p><pre class="prettyprint" name="code" style="white-space: nowrap; word-wrap: break-word; box-sizing: border-box; position: relative; overflow-y: hidden; overflow-x: auto; margin-top: 0px; margin-bottom: 1.1em; font-family: "Source Code Pro", monospace; padding: 5px 5px 5px 60px; font-size: 14px; line-height: 1.45; word-break: break-all; color: rgb(51, 51, 51); background-color: rgba(128, 128, 128, 0.0470588); border: 1px solid rgba(128, 128, 128, 0.0745098); border-radius: 0px;"><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">这里有一点需要说明一下，</span><code style="background-color: rgb(255, 255, 255); font-family: "Source Code Pro", monospace; padding: 2px 4px; font-size: 12.6px; color: rgb(63, 63, 63);">getFileLists()</code><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">是按照文件名升序顺序读取（大家都知道，文件名为字符串，comparable），文件命名最好不要以</span><code style="background-color: rgb(255, 255, 255); font-family: "Source Code Pro", monospace; padding: 2px 4px; font-size: 12.6px; color: rgb(63, 63, 63);">1, 2, ..., 11, ...</code><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">这种方式存储，因为这么存，你就会发现</span><code style="background-color: rgb(255, 255, 255); font-family: "Source Code Pro", monospace; padding: 2px 4px; font-size: 12.6px; color: rgb(63, 63, 63);">1</code><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">之后的文件可能不是你想的</span><code style="background-color: rgb(255, 255, 255); font-family: "Source Code Pro", monospace; padding: 2px 4px; font-size: 12.6px; color: rgb(63, 63, 63);">2, 3, 4, ...</code><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">，而是</span><code style="background-color: rgb(255, 255, 255); font-family: "Source Code Pro", monospace; padding: 2px 4px; font-size: 12.6px; color: rgb(63, 63, 63);">11, 12, 13, ...</code><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">。</span>

如果你想按照顺序的某一堆数据是一种类别（我是这么做的，因为便于产生对应的labels），建议使用等宽零位补齐的方式命名，例如：00001, 0002, ..., 0011, ...，那么文件读取的顺序就会如我们所设定。

总结一下实现方法（仅供参考）：

采集样本的时候可以先类别存于不同的文件夹，命名就随意吧，如果是使用一些抠图软件，也不用纠结一个一个手工修改成自己想要的命名（这么做工作量很大，真的很蛋疼。。。）；
每一类数据整理好后，依次将每一类的数据，用程序读取并另存一份（读取使用getFileLists()，反正是一类的，也无所谓先后顺序）：

<span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">后面的其他类别也可以这样，为了按照顺序区分，依次进行其他类别的时候，只需要在改动文件夹后，将</span><code style="background-color: rgb(255, 255, 255); font-family: "Source Code Pro", monospace; padding: 2px 4px; font-size: 12.6px; color: rgb(63, 63, 63);">sprintf(curfile, "C:\\Samples\\class-1\\%04d.jpg", i);</code><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">中的第三个参数</span><code style="background-color: rgb(255, 255, 255); font-family: "Source Code Pro", monospace; padding: 2px 4px; font-size: 12.6px; color: rgb(63, 63, 63);">i</code><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">改为</span><code style="background-color: rgb(255, 255, 255); font-family: "Source Code Pro", monospace; padding: 2px 4px; font-size: 12.6px; color: rgb(63, 63, 63);">i+k</code><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">，这里</span><code style="background-color: rgb(255, 255, 255); font-family: "Source Code Pro", monospace; padding: 2px 4px; font-size: 12.6px; color: rgb(63, 63, 63);">k</code><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">是前面一类或几类的样本总数。</span>

最后，将重新命名的文件，存在一个文件夹里，记清楚类别对应的区间范围，以便生成labels。

读取上述最终文件内的所有文件，接下来，生成labels（labels一般用[0, 9]组成的整数字）：

<span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">当然，你也可以用</span><code style="background-color: rgb(255, 255, 255); font-family: "Source Code Pro", monospace; padding: 2px 4px; font-size: 12.6px; color: rgb(63, 63, 63);">image_labels.push_back()</code><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">把所有的</span><code style="background-color: rgb(255, 255, 255); font-family: "Source Code Pro", monospace; padding: 2px 4px; font-size: 12.6px; color: rgb(63, 63, 63);">labels</code><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">设置，但是熟悉</span><code style="background-color: rgb(255, 255, 255); font-family: "Source Code Pro", monospace; padding: 2px 4px; font-size: 12.6px; color: rgb(63, 63, 63);">vector</code><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">的话，就会明白使用初始化长度，比那种做法更加高效（可以阅读本人的博客： </span><a target=_blank target="_blank" href="http://blog.csdn.net/yhl_leo/article/details/47759729" style="font-family: "microsoft yahei"; background-color: rgb(255, 255, 255); text-decoration: none; color: rgb(12, 137, 207);">C++ 容器（一）：顺序容器简介</a><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">）。然后就相应地修改某些索引区间内的</span><code style="background-color: rgb(255, 255, 255); font-family: "Source Code Pro", monospace; padding: 2px 4px; font-size: 12.6px; color: rgb(63, 63, 63);">label</code><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">值：</span>

<span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">都准备好后，就可以开始生成想要的二进制文件了：</span>

<span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">到这里，已经制作好了二进制数据集，我很懒，想直接基于</span><code style="background-color: rgb(255, 255, 255); font-family: "Source Code Pro", monospace; padding: 2px 4px; font-size: 12.6px; color: rgb(63, 63, 63);">tensorflow/models/image/cifar10</code><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">模块的源码跑我定义的数据集，想想只要跟</span><code style="background-color: rgb(255, 255, 255); font-family: "Source Code Pro", monospace; padding: 2px 4px; font-size: 12.6px; color: rgb(63, 63, 63);">cifar10</code><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">数据集类似，那肯定没什么问题，下面是官网上下载的</span><code style="background-color: rgb(255, 255, 255); font-family: "Source Code Pro", monospace; padding: 2px 4px; font-size: 12.6px; color: rgb(63, 63, 63);">cifar-10-binary.tar</code><span style="color: rgb(85, 85, 85); font-family: "microsoft yahei"; background-color: rgb(255, 255, 255);">解压后内容：</span>

cifar.rar