交叉验证

最新推荐文章于 2020-07-29 12:01:00 发布

JiangCaifu

最新推荐文章于 2020-07-29 12:01:00 发布

阅读量320

点赞数

分类专栏： python学习

本文链接：https://blog.csdn.net/JiangCaifu/article/details/88312112

版权

python学习专栏收录该内容

41 篇文章 1 订阅

订阅专栏

from sklearn.model_selection import train_test_split
#Whole dataset
#切分：切分时先进行洗牌的操作再切分
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.3,random_state=0)
print("Number transactions train dataset: ",len(X_train))
print("Number transactions test dataset: ",len(X_test))
print("Total number of transactions: ",len(X_train)+len(X_test))
#Undersampled dataset
X_train_undersample,X_test_undersample,y_train_undersample,y_test_undersample=train_test_split(X_undersample,
                                                                                               Y_undersample,
                                                                                               test_size=0.3,
                                                                                               random_state=0)
print(" ")
print("Number transactions train dataset: ",len(X_train_undersample))
print("Number transactions test dataset: ",len(X_test_undersample))
print("total number of transations: ",len(X_train_undersample)+len(X_test_undersample))