这里学习一下前面用到的读取mnist数据库文件的代码。其实并没有用到Tensorlfow的东西,但是读取数据库文件是使用Tensorflow编程实现功能的基础,因此归到Tensorflow的学习笔记中。
这里需要注意的主要有以下几点:
1.dense_to_one_hot函数
2.DataSet类中next_batch函数
3.read_data_sets函数
这里有一个问题:
dense_to_one_hot函数里
def dense_to_one_hot(labels_dense, num_classes=10):
"""Convert class labels from scalars to one-hot vectors."""
num_labels = labels_dense.shape[0]
index_offset = numpy.arange(num_labels) * num_classes
labels_one_hot = numpy.zeros((num_labels, num_classes))
#labels_dense.ravel()将整个数组展成一个一维数组
#labels_dense.flat[i]即将labels_dense看成一个一维数组,取其第i个变量
labels_one_hot.flat[index_offset + labels_dense.ravel()] = 1#报错?
return labels_one_hot
注释有报错那一行,在整体程序运行的时候并没有出错,单独拿出来就出错,原因未知,还需要继续学习。
具体代码如下所示,解析如代码中注释所示:
#coding=utf-8
#input_data.py的详解
#学习读取数据文件的方法,以便读取自己需要的数据库文件(二进制文件)
"""Functions for downloading and reading MNIST data."""
from __future__ import print_function
import gzip
import os
import urllib
import numpy
SOURCE_URL = 'http://yann.lecun.com/exdb/mnist/'
def maybe_download(filename, work_directory):
"""Download the data from Yann's website, unless it's already here."""
#判断目录文件是否存在,不存在则创建该目录
if not os.path.exists(work_directory):
os.mkdir(work_directory)
#需要读取的文件路径
filepath = os.path.join(work_directory, filename)
if