作用:将数据集随机划分为训练集和测试集
使用:X_train,X_test,Y_train,Y_test = train_test_split(X,Y,random_state = 0)
返回:X_train,X_test,Y_train,Y_test
参数:
X:原始数据集中的样品特征
Y:原始数据集中的预测结果
random_state:该组随机数的编号,重复划分时一样的数值保证得到一样的随机数,不填时不能保证
———关注我的公众号,一起学数据挖掘————
作用:将数据集随机划分为训练集和测试集
使用:X_train,X_test,Y_train,Y_test = train_test_split(X,Y,random_state = 0)
返回:X_train,X_test,Y_train,Y_test
参数:
X:原始数据集中的样品特征
Y:原始数据集中的预测结果
random_state:该组随机数的编号,重复划分时一样的数值保证得到一样的随机数,不填时不能保证
———关注我的公众号,一起学数据挖掘————