在上一篇介绍Tensorflow 中的Keral进行基本图像分类的文章中,有以下加载Fashion MNIST数据集的代码
fashion_mnist = tf.keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
加载数据集会返回四个 NumPy 数组:
train_images
和train_labels
数组是训练集,即模型用于学习的数据。- 测试集、
test_images
和test_labels
数组会被用来对模型进行测试。
有以下几个问题?
1.什么是NumPy数组?
2.为什么是四个?
一.什么是Numpy数组?
NumPy数组是Numerical Python库中的核心数据结构,它是一个多维数组对象,可以存储相同类型的元素。 NumPy数组支持高效的数学运算和线性代数操作,因此在科学计算领域中被广泛使用
NumPy数组由两部分组成:实际的数据和描述这些数据的元数据。大部分操作仅针对元数据,而不改变底层实际的数据。
NumPy提供了大量的库函数和操作,帮助程序员轻松地进行数值计算,广泛应用于机器学习模型、图像处理和计算机图形学、数学任务等领域
具体关于Numpy的数据结构ndarray入门、数据存取与函数调用,可参见上传的资料:
https://download.csdn.net/download/pisceshsu/89670807
二.为什么是四个?
在tensorflow官网中有fashion mnist数据集的load_data函数接口说明:
tf.keras.datasets.fashion_mnist.load_data | TensorFlow v2.16.1
从上图可以看出,返回值(Returns)有四个,x_train, y_train, x_test, y_test ,
在我们的代码中,分别赋值给了 train_images, train_labels, test_images, test_labels
每个返回值都是Numpy数组,数组的存储格式和定义的内部数据结构有关,每个数据集可能不一样。