K折交叉验证

最新推荐文章于 2024-06-18 21:26:03 发布

Kevin_D98

最新推荐文章于 2024-06-18 21:26:03 发布

阅读量347

点赞数 8

分类专栏：动手学深度学习Pytorch版文章标签：深度学习 python 机器学习

本文链接：https://blog.csdn.net/dingning12469/article/details/135474199

版权

动手学深度学习Pytorch版专栏收录该内容

26 篇文章 0 订阅

订阅专栏

前言

K折交叉验证有助于模型选择和超参数调整。我们首先需要定义一个函数，在K折交叉验证过程中返回第i折的数据。具体而言，就是选择第i个切片作为验证数据，其余部分作为训练数据。

获取第i折数据

def get_k_fold_data(k,i,X,y):
    assert k>1
    fold_size=X.shape[0]//k # 每一折的大小
    X_train,y_train=None,None
    for j in range(k):
        idx=slice(j*fold_size,(j+1)*fold_size) # 生成每一折内的序号
        X_part,y_part=X[idx,:],y[idx]
        if j==i:
            X_valid,y_valid=X_part,y_part
        elif X_train is None:
            X_train,y_train=X_part,y_part
        else:
            X_train=torch.cat([X_train,X_part],0)
            y_train=torch.cat([y_train,y_part],0)
    return X_train,y_train,X_valid,y_valid

K折交叉训练

def k_fold(k,X_train,y_train,num_epochs,learning_rate,weight_decay,batch_size):
    train_l_sum,valid_l_sum=0,0
    for i in range(k):
        data=get_k_fold_data(k,i,X_train,y_train)
        net=get_net()
        train_ls,valid_ls=train(net,*data,num_epochs,learning_rate,weight_decay,batch_size)
        train_l_sum+=train_ls[-1]
        valid_l_sum+=valid_ls[-1]
        if i==0:
            plt.plot(range(1,num_epochs+1),train_ls,label='train')
            plt.plot(range(1,num_epochs+1),valid_ls,label='valid')
            plt.yscale('log')
            plt.xlabel('epoch')
            plt.ylabel('rmse')
            plt.xlim([1,num_epochs])
            plt.legend()
            plt.show()
        print(f'折{i+1}，训练log rmse{float(train_ls[-1]):f}, '
              f'验证log rmse{float(valid_ls[-1]):f}')
    return train_l_sum/k,valid_l_sum/k