from sklearn.model_selection import train_test_split
#从原始数据中划分训练集和测试集
X_tr, X_vld, lab_tr, lab_vld = train_test_split(X_train, labels_train,
test_size=0.3, random_state = 123)
参数:
输入数据(X_train)和标签(labels_train)
test_size:划分比例
random_state:设定随机数种子,保证下一次划分的时候划分结果不发生变化
设置成一个固定的值(比如这里的"123"),每次产生的随机数是相同的.
随机数种子设置为0或者不设置则每次随机划分,产生的结果不一样
返回结果:
返回训练集(X_tr),测试集(X_vld),训练标签(lab_tr)和测试标签(lab_vld).