⚽开发平台:jupyter lab
🎈运行环境:python3、tensorflow2.x
第2章 tensorflow和keras快速入门 | iris数据集测试
1. iris数据集 - 程序部分
1.1 程序2.5(完整代码)
import tensorflow as tf
import numpy as np
## 加载数据
from sklearn.datasets import load_iris
data = load_iris()
## 数据集的关键字
data.keys() #dict_keys(['data', 'target', 'frame', 'target_names', 'DESCR', 'feature_names', 'filename'])
## 转换数据形式
iris_data = np.float32(data.data)
iris_target = data.target
iris_data.shape,iris_target.shape #((150, 4), (150,))
## 对目标函数进行热编码化,数目为3
set(iris_target) # {0, 1, 2}
iris_target = np.float32(tf.keras.utils.to_categorical(iris_target,num_classes = 3))
iris_target
## 模型构建
input_xs = tf.keras.Input(shape=(4,),name='input_xs') ## 输入层
out = tf.keras.layers.Dense(32,activation='relu',name = 'dense_1')(input_xs)###隐藏层
out = tf.keras.layers.Dense(16,activation='relu',name = 'dense_2')(out)
logits = tf.keras.layers.Dense(3,activation = "softmax",name = 'prediction')(out)##输出
model = tf.keras.Model(inputs = input_xs,outputs = logits)
opt = tf.optimizers.Adam(1e-3) ### 模型优化器
model.compile(optimizer = tf.optimizers.Adam(1e-3),loss = tf.losses.categorical_crossentropy,metrics = ['accuracy'])
## 模型训练
hist = model.fit(x=iris_data,y= iris_target,batch_size = 128,epochs = 500)
## 模型评估
loss,accuracy = model.evaluate(iris_data,iris_target)
print('test loss',loss)
print('accuracy',accuracy)
1.2 数据展示
import matplotlib.pyplot as plt
### 精确度变化
plt.plot(range(500),hist.history.get('accuracy'))
### 损失度变化
plt.plot(range(500),hist.history.get('loss'))
1.3 模型参数
### 模型参数获取
model.summary()
1.4 数据预测
## 拿数据重新预测
predict = model.predict(iris_data)
## 获取最大概率的下标值
np.argmax(predict,axis = -1)
2.知识点
2.1 model.evaluate 和 model.predict 的区别
(1)model.evaluate
说明:输入数据和标签,输出损失和精确度。
# 评估模型,不输出预测结果
loss,accuracy = model.evaluate(X_test,Y_test)
print('loss:',loss)
print('accuracy:',accuracy)
(2)model.predict
说明:输入测试数据,输出预测结果 (通常用在需要得到预测结果的时候)。
#模型预测,输入测试集,输出预测结果
y_pred = model.predict(X_test,batch_size = 1)
(3)两者差异
1.输入输出不同:
- model.evaluate输入数据(data)和金标准(label),然后将预测结果与金标准相比较,得到两者误差并输出.
- model.predict输入数据(data),输出预测结果
2.是否需要真实标签(金标准)
- model.evaluate需要,因为需要比较预测结果与真实标签的误差
- model.predict不需要,只是单纯输出预测结果,全程不需要金标准的参与.