tf.keras.datasets
里面放了一些小的numpy数据集,主要用于做一些测试
放了哪些数据集呢?一共有7个,分别是:
- boston_housing: Boston房价回归数据集
- cifar10: CIFAR10小图分类数据集
- cifar100: CIFAR100小图分类数据集
- fasion_mnist: Fashion-MNIST数据集
- mnist: MNIST手写数字数据集
- imdb: IMDB情感分类数据集
- reuters: Reuters主题分类数据集
boston_housing
http://lib.stat.cmu.edu/datasets/boston
每条数据包含房屋的13种属性,以及房子的均价(k$)
(x_train, y_train), (x_test, y_test) = tf.keras.datasets.boston_housing.load_data() #可以加载数据集
返回的x_train和x_test都是(num_samples,13)的numpy矩阵
y_train, y_test都是(num_sample,)的numpy矩阵
tf.keras.datasets.boston_housing.load_data()有3个参数
分别是path, test_split, seed。默认值为
path=‘boston_housing.npz’
test_split=0.2
seed=113
path是boston_housing在本地的缓存地址,默认相对路径是~/.keras/datasets,如果这个地址没有缓存过