1.定义
由于数据集存在集中性,普通的人为划分可能会造成测试集(test_data)和训练集(train_data)过于集中,因此需要采用某种方法对数据进行随机划分。
2.方法
import sklearn.model_selection as ms
ms.train_test_split(输入集,输出集,test_size=测试集占比,random_state=随机种子)
3.例子
import sklearn.model_selection as ms
train_x,test_x,train_y,test_y = \
ms.train_test_split(x,y,test_size=0.25,random_state=7)