《一个图像复原实例入门深度学习&TensorFlow—第四篇》获取数据

获取用于训练和测试的数据

1、 下载MNIST数据集到本地

不知道MNIST数据集是什么?看这里:http://www.tensorfly.cn/tfdoc/tutorials/mnist_beginners.html
根据上一篇的介绍,我们用于训练的数据应该是一个一个的mini-batch,因此,对于我们即将处理的数据,最重要的就是从训练集中分出一个一个的mini-batch,看起来好像不难,但是我们要保证每次导入mini-batch中的数据都是随机的,而且所有数据在一个epoch(训练数据全部使用一次就是完成了一个epoch)只能出现一次,mini-batch中的image还要必须和label对应,而且整个过程要保证快速,对于庞大、复杂、类型多样的训练数据,这可不是已经容易的事情。所以现有的用于深度学习入门的MNIST手写字符识别这个例子中,数据导入这一块直接被忽略了,MNIST直接提供了划分mini-batch的函数给用户调用,本文不使用MNIST数据集中封装的函数进行数据导入,因为我们学习深度学习是为了处理自己的数据集构建自己的网络,那时候可没有封装好的函数可以用!但我们也不好获取那么多规范的数据,我们也选用MNIST数据集,将数据下载到本地,然后自己实现高效的划分mini-batch。

1.1 获取input_data.py文件

复制下面的代码,到Spyder中粘贴:

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import gzip
import os
import tempfile

import numpy
from six.moves import urllib
from six.moves import xrange  # pylint: disable=redefined-builtin
import tensorflow as tf
from tensorflow.contrib.learn.python.learn.datasets.mnist import read_data_sets

按F5运行重命名为input_data.py
这里写图片描述

1.2
  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值