Keras入门（八）K折交叉验证

最新推荐文章于 2025-02-19 16:56:19 发布

山阴少年

最新推荐文章于 2025-02-19 16:56:19 发布

阅读量1.1w

点赞数 8

分类专栏：机器学习文章标签： Keras K折交叉验证

本文链接：https://blog.csdn.net/jclian91/article/details/113096228

版权

机器学习专栏收录该内容

37 篇文章

订阅专栏

本文详细介绍了如何在Keras中实现K折交叉验证，以提升深度神经网络模型的稳定性和鲁棒性，通过实例演示了在解决IRIS数据集多分类问题时的应用，并展示了10折交叉验证的平均准确率和损失。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在文章Keras入门（一）搭建深度神经网络（DNN）解决多分类问题中，笔者介绍了如何搭建DNN模型来解决IRIS数据集的多分类问题。
本文将在此基础上介绍如何在Keras中实现K折交叉验证。

什么是K折交叉验证？

K折交叉验证是机器学习中的一个专业术语，它指的是将原始数据随机分成K份，每次选择K-1份作为训练集，剩余的1份作为测试集。交叉验证重复K次，取K次准确率的平均值作为最终模型的评价指标。一般取K=10，即10折交叉验证，如下图所示：

用交叉验证的目的是为了得到可靠稳定的模型。K折交叉验证能够有效提高模型的学习能力，类似于增加了训练样本数量，使得学习的模型更加稳健，鲁棒性更强。选择合适的K值能够有效避免过拟合。

Keras实现K折交叉验证

我们仍采用文章Keras入门（一）搭建深度神经网络（DNN）解决多分类问题中的模型，如下：
DNN模型结构图
同时，我们对IRIS数据集采用10折交叉验证，完整的实现代码如下：

# -*- coding: utf-8 -*-
# model_train.py
# Python 3.6.8, TensorFlow 2.3.0, Keras 2.4.3
# 导入模块
import keras as K
import pandas as pd
from sklearn.model_selection import KFold


# 读取CSV数据集
# 该函数的传入参数为csv_file_path: csv文件路径
def load_data(sv_file_path):
    iris = pd.read_csv(sv_file_path)
    target_var = 'class'  # 目标变量
    # 数据集的特征
    features = list(iris.columns)
    features.remove(target_var)
    # 目标变量的类别
    Class = iris[target_var].unique()
    # 目标变量的类别字典
    Class_dict = dict(zip(Class, range(len(Class))))
    # 增加一列target, 将目标变量转化为类别变量
    iris['target'] = iris[target_var].apply(lambda x: Class_dict[x])

    return features, 'target', iris


# 创建模型
def create_model():
    init = K.initializers.glorot_uniform(seed=1)
    simple_adam = K.optimizers.Adam()
    model = K.models.Sequential()
    model.add(K.layers.Dense(units=5, input_dim=4, kernel_initializer=init, activation='relu'))
    model.add(K.layers.Dense(units=6, kernel_initializer=init, activation='relu'))
    model.add(K.layers.Dense(units=3, kernel_initializer=init, activation='softmax'))
    model.compile(loss='sparse_categorical_crossentropy', optimizer=simple_adam, metrics=['accuracy'])
    return model


def main():
    # 1. 读取CSV数据集
    print("Loading Iris data into memory")
    n_split = 10
    features, target, data = load_data("./iris_data.csv")
    x = data[features]
    y = data[target]
    avg_accuracy = 0
    avg_loss = 0
    for train_index, test_index in KFold(n_split).split(x):
        print("test index: ", test_index)
        x_train, x_test = x.iloc[train_index], x.iloc[test_index]
        y_train, y_test = y.iloc[train_index], y.iloc[test_index]

        print("create model and train model")
        model = create_model()
        model.fit(x_train, y_train, batch_size=1, epochs=80, verbose=0)

        print('Model evaluation: ', model.evaluate(x_test, y_test))
        avg_accuracy += model.evaluate(x_test, y_test)[1]
        avg_loss += model.evaluate(x_test, y_test)[0]

    print("K fold average accuracy: {}".format(avg_accuracy / n_split))
    print("K fold average accuracy: {}".format(avg_loss / n_split))


main()