这一篇主要目的在于学习利用python进行数据的分割,给出了两段代码(case1、2),主要是围绕这两段代码展开,分析一下python如何分割数据。
不喜欢代码的可以直接先看文中运行结果截图,如有需要再看代码。
分割数据的意义何在?举个很简单的例子,比如在进行十折交叉验证(Ten-folder cross validation)、留一法验证(Leave-one-out cross validation)等往往需要将数据分割成不同的部分以充分利用数据进行训练。
我们分两个部分进行,第一部分先看看怎么样将一个数据分割成多块;第二部分看看在实际数据训练过程中如何划分不同的训练集、验证集。注:代码实现方式有很多种,我这只是其中一种,主要学习思维。
-----------------------------
第一部分:怎么样将一个数据集分割成多块。就直接上代码了,代码里的大部分注释已经说的很清楚了,有一个关键点我会特别截图说一下。
# -*- coding: utf-8 -*-"""数据N折分"""import numpy as np###### case 1 ######def N_split_data(data,N): data = np.array(data) #获取数据集长度 num = len(data) #获取分割块内数据平均数量 div = in