首先介绍一下Keras:
- List itemKeras是一个高层的神经网络和深度学习库;
- 可以快速搭建神经网络模型,非常易于调试和扩展;
- 是TensorFlow的官方API
- 内置了一些常用的公共数据集,可以通过keras.datasets模块加载和访问
Keras中集成的数据集如下:
其中,波士顿房价数据集:
- 涵盖了麻省波士顿的506个不同地区的房屋数据
- 404条训练数据集,102条测试数据集
- 每条数据有14个字段,包含13个属性,和1个房价的平均值
14个字段具体介绍如下:
(1)加载数据集 —.load_data()方法
注意:使用.load_data()方法得到的数据集是NumPy数组的形式
加载波士顿房价数据集完整代码如下:
import tensorflow as tf
boston_housing = tf.keras.datasets.boston_housing
(train_x,train_y),(test_x,test_y) = boston_housing.load_data()
执行结果如下:
(2) 改变数据集的划分比例
只需要在load_data()函数中添加参数test_split=测试集占全部数据的比例值
(train_x,train_y),(test_x,test_y) = boston_housing.load_data(test_split=0)
下面是查看波士顿数据集的一些操作,可自行查看,了解数据集的基本情况。
''' 查看数据集基本信息'''
print("