基于Keras的Python 实践（2）

最新推荐文章于 2024-07-20 15:20:48 发布

李沛轩1

最新推荐文章于 2024-07-20 15:20:48 发布

阅读量69

点赞数

文章标签： tensorflow

本文链接：https://blog.csdn.net/lipeixuan_1/article/details/115919273

版权

评估深度学习模型

设计和配置深度学习模型时，有很多选项需要进行配置，大多数需要试错得到，因此，一个可靠的用来评估神经网络的深度学习模型的方法很重要。

自动评估

在实现上，可以通过将fit()函数的验证分割参数（validation_split）设置为数据集大小的百分比来实现

from keras.models import Sequential
from keras.layers import Dense
import numpy as np

# 设定随机数种子
np.random.seed(7)

# 导入数据
dataset = np.loadtxt('pima-indians-diabetes.csv', delimiter=',')
# 分割输入x和输出Y
x = dataset[:, 0 : 8]
Y = dataset[:, 8]

# 创建模型
model = Sequential()
model.add(Dense(12, input_dim=8, activation='relu'))
model.add(Dense(8, activation='relu'))
model.add(Dense(1, activation='sigmoid'))

# 编译模型
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

# 训练模型并自动评估模型
model.fit(x=x, y=Y, epochs=150, batch_size=10, validation_split=0.2)

手动评估

使用scikit 机器学习库的train_test_split()函数将数据集分成训练数据集和评估数据集。

from keras.models import Sequential
from keras.layers import Dense
from sklearn.model_selection import train_test_split
import numpy as np

seed = 7
# 设定随机数种子
np.random.seed(seed)

# 导入数据
dataset = np.loadtxt('pima-indians-diabetes.csv', delimiter=',')
# 分割输入x和输出Y
x = dataset[:, 0 : 8]
Y = dataset[:, 8]

# 分割数据集
x_train, x_validation, Y_train, Y_validation = train_test_split(x, Y, test_size=0.2, random_state=seed)

# 构建模型
model = Sequential()
model.add(Dense(12, input_dim=8, activation='relu'))
model.add(Dense(8, activation='relu'))
model.add(Dense(1, activation='sigmoid'))

# 编译模型
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

# 训练模型
model.fit(x_train, Y_train, validation_data=(x_validation, Y_validation), epochs=150, batch_size=10)

K折交叉验证

机器学习模型评估的黄金标准是K折交叉验证。它提供了模型对未知数据性能的可靠估计。
K折交叉验证过程是将数据集分为k个子集，选择其中一个子集作为评估数据集，利用剩余的k-1个子集训练模型，并用预留的子集对模型进行评估。重复该过程，直到所有的子集被赋予作为评估数据集的机会，采用k个模型评估结果的平均值作为模型最终的评估结果。

该实例使用StratifiesKFold将数据分割成10个子集，并利用这10个子集创建和评估10个模型，且收集这10个模型的评估得分。通过设置verbose为0，来关闭模型的fit()和evaluate函数的详细输出。

from keras.models import Sequential
from keras.layers import Dense
import numpy as np
from sklearn.model_selection import StratifiedKFold

seed = 7
# 设定随机数种子
np.random.seed(seed)

# 导入数据
dataset = np.loadtxt('pima-indians-diabetes.csv', delimiter=',')
# 分割输入x和输出Y
x = dataset[:, 0 : 8]
Y = dataset[:, 8]

kfold = StratifiedKFold(n_splits=10, random_state=seed, shuffle=True)
cvscores = []
for train, validation in kfold.split(x, Y):
    # 创建模型
    model = Sequential()
    model.add(Dense(12, input_dim=8, activation='relu'))
    model.add(Dense(8, activation='relu'))
    model.add(Dense(1, activation='sigmoid'))

    # 编译模型
    model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

    # 训练模型
    model.fit(x[train], Y[train], epochs=150, batch_size=10, verbose=0)

    # 评估模型
    scores = model.evaluate(x[validation], Y[validation], verbose=0)

    # 输出评估结果
    print('%s: %.2f%%' % (model.metrics_names[1], scores[1] * 100))
    cvscores.append(scores[1] * 100)

# 输出均值和标准差
print('%.2f%% (+/- %.2f%%)' % (np.mean(cvscores), np.std(cvscores)))

李沛轩1

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
基于Keras的Python 实践（2）

评估深度学习模型设计和配置深度学习模型时，有很多选项需要进行配置，大多数需要试错得到，因此，一个可靠的用来评估神经网络的深度学习模型的方法很重要。自动评估在实现上，可以通过将fit()函数的验证分割参数（validation_split）设置为数据集大小的百分比来实现from keras.models import Sequentialfrom keras.layers import Denseimport numpy as np# 设定随机数种子np.random.seed(7)#
复制链接

扫一扫