如何用TensorFlow训练和识别/分类自定义图片

最新推荐文章于 2025-11-02 12:29:56 发布

原创

最新推荐文章于 2025-11-02 12:29:56 发布 · 4w 阅读

156 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #tensorflow #python #图片

本文介绍了如何在TensorFlow中使用自定义图片集进行训练和分类，通过解析和提取mnist数据集，将图片保存为bmp格式，再读取并输入神经网络。关键在于调整代码以适应自定义图片源，特别是理解如何将图片数据转化为feed_dict可接受的格式。

很多正在入门或刚入门TensorFlow机器学习的同学希望能够通过自己指定图片源对模型进行训练，然后识别和分类自己指定的图片。但是，在TensorFlow官方入门教程中，并无明确给出如何把自定义数据输入训练模型的方法。现在，我们就参考官方入门课程《Deep MNIST for Experts》一节的内容(传送门：https://www.tensorflow.org/get_started/mnist/pros)，介绍如何将自定义图片输入到TensorFlow的训练模型。

在《Deep MNISTfor Experts》一节的代码中，程序将TensorFlow自带的mnist图片数据集mnist.train.images作为训练输入，将mnist.test.images作为验证输入。当学习了该节内容后，我们会惊叹卷积神经网络的超高识别率，但对于刚开始学习TensorFlow的同学，内心可能会产生一个问号：如何将mnist数据集替换为自己指定的图片源？譬如，我要将图片源改为自己C盘里面的图片，应该怎么调整代码？

我们先看下该节课程中涉及到mnist图片调用的代码：

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)
batch = mnist.train.next_batch(50)
train_accuracy = accuracy.eval(feed_dict={x: batch[0], y_: batch[1], keep_prob: 1.0})
train_step.run(feed_dict={x: batch[0], y_: batch[1], keep_prob: 0.5})
print('test accuracy %g' % accuracy.eval(feed_dict={x: mnist.test.images, y_: mnist.test.labels, keep_prob: 1.0}))

对于刚接触TensorFlow的同学，要修改上述代码，可能会较为吃力。我也是经过一番摸索，才成功调用自己的图片集。

要实现输入自定义图片，需要自己先准备好一套图片集。为节省时间，我们把mnist的手写体数字集一张一张地解析出来，存放到自己的本地硬盘，保存为bmp格式，然后再把本地硬盘的手写体图片一张一张地读取出来，组成集合，再输入神经网络。mnist手写体数字集的提取方式详见《

最低0.47元/天解锁文章

30 条评论

f_lu365 2019.11.26
为什么要判断后值存入input_images[index][w+h*width]的[w+h*width]列中

00AutoMan00 2019.08.23
博主你好，我在运行的时候train_step.run这句总是在报错，怀疑是不是一定要在CPU条件下跑，博主能否贴一个CPU版本的 [code=python] for n in range(batches_count): train_step.run(feed_dict={x: input_images[n*batch_size:(n+1)*batch_size], y_: input_labels[n*batch_size:(n+1)*batch_size], keep_prob: 0.5}) if remainder > 0: start_index = batches_count * batch_size; train_step.run(feed_dict={x: input_images[start_index:input_count-1], y_: input_labels[start_index:input_count-1],keep_prob: 0.5}) [/code]

CNTJU 2019.03.19
博主，为什么会出现这个问题，应该怎么解决？ ValueError: Cannot feed value of shape (0,) for Tensor Placeholder:0, which has shape '(?, 784)' 一共读取了 0 个输入图像， 0 个标签数据集分成 1 批, 前面每批 60 个数据，最后一批 0 个数据
- KKKiara回复weixin_44648995 2019.08.07
  [reply]weixin_44648995[/reply] 你好我的结果也是这样会不会是数据集的问题？
- weixin_43438978回复weixin_44648995 2019.07.31
  [reply]weixin_44648995[/reply] 你的图片是28*28的吗
- weixin_44648995回复hxg学java 2019.05.18
  [reply]qq_40378393[/reply] 没有你呢
- weixin_44648995回复hxg学java 2019.05.18
  [reply]qq_40378393[/reply] [code=python] 一共读取了 1 个输入图像， 1 个标签数据集分成 1 批, 前面每批 60 个数据，最后一批 1 个数据 iteration 0: accuracy 0.0 iteration 5: accuracy 0.0 iteration 10: accuracy 0.0 iteration 15: accuracy 0.0 iteration 20: accuracy 0.0 iteration 25: accuracy 0.0 iteration 30: accuracy 0.0 iteration 35: accuracy 0.0 iteration 40: accuracy 0.0 iteration 45: accuracy 0.0 iteration 50: accuracy 0.0 iteration 55: accuracy 0.0 iteration 60: accuracy 0.0 iteration 65: accuracy 0.0 iteration 70: accuracy 0.0 iteration 75: accuracy 0.0 iteration 80: accuracy 0.0 iteration 85: accuracy 0.0 iteration 90: accuracy 0.0 iteration 95: accuracy 0.0 完成训练! Process finished with exit code 0 [/code] 为什么我的输出是这样的啊希望楼主赐教我qq240273111
- hxg学java回复CNTJU 2019.04.11
  [reply]CNTJU[/reply] 请问解决了吗？我也遇到了这个问题。

tb_7115591 2019.03.14
请问怎么提高迭代次数，我这里最多计算到第95次，请赐教，不胜感激
- Liiga回复tb_7115591 2019.04.21
  [reply]tb_7115591[/reply] 第101行 [code=python] iterations = 100 [/code]
- CNTJU回复tb_7115591 2019.03.19
  [reply]tb_7115591[/reply] 你好，我这里运行出了一些问题。想请教一下[code=html] ValueError: Cannot feed value of shape (0,) for Tensor Placeholder:0, which has shape '(?, 784)' 一共读取了 0 个输入图像， 0 个标签数据集分成 1 批, 前面每批 60 个数据，最后一批 0 个数据 [/code]

赌上青春 2019.02.25
方便的话加下我的QQ：1875810036

qq_28628129 2018.05.30
iterate_accuracy = accuracy.eval(feed_dict={x: input_images, y_: input_labels, keep_prob: 1.0})这句代码显示gpu显存不足，我在网上找到的解决方法是分批测试，但是不知道怎么写，想问问楼主up可以帮一下忙嘛？

蹊言君 2018.05.14
请问为什么要在生成图片数据和标签的时候：input_labels[index][i] = 1，这句的出发点是？

weixin_40290344 2018.04.24
博主你好，我按照你的方法下载了mnist数据集保存在电脑里，然后套这篇博文的程序时，dir = './custom_images/%s/' % i 这里该怎么改动啊？
- weixin_42064703回复weixin_40290344 2019.03.06
  [reply]weixin_40290344[/reply] 请问找到解决办法了吗

aha__ 2018.04.13
博主请问一下 input_images = np.array([[0] * 20000000000 for i in range(input_count)]) MemoryError这个报错怎么处理，是我的图片像素太高来码
- qq_28628129回复aha__ 2018.05.29
  [reply]aha__[/reply] 干的漂亮
- ShadowN1ght回复aha__ 2018.04.15
  [reply]aha__[/reply] 1G的内存大概可以存储10亿个字节，你这是200亿个单元，需要至少20G的内存。

ReXueXiaoQingNian 2018.04.12
博主，如果换成自己的图片数据（RGB），root文件夹下有多个子文件夹，用子文件夹的名称作为每类图片数据的标签，需要怎么修改呀？还有就是你直接用图片作为输入了么，这样效率还不会比较低？以前一直用的caffe，tf新手，博主赐教哈。
- 橘片罐头回复ReXueXiaoQingNian 2018.10.15
  [reply]ReXueXiaoQingNian[/reply] 您好，我和您同样的问题，您解决了么？可以加交流一下么 qq：642596481 谢谢