第1关:划分训练集与测试集
##参考的是 微风轻轻吹拂 的CSDN提问和 吃肉的小馒头 的回答
import pandas as pd
from sklearn import model_selection
#*************** BEIGN ******************
# 使用pandas库的read_csv读入毒蘑菇数据集(./data/mushrooms.csv)
data = pd.read_csv('./data/mushrooms.csv')
pd.set_option("max_columns", 5)
# 划分训练集和测试集,其中70%的数据用于训练,30%的数据用于测试
y=data.iloc[:,22]
X=data.iloc[:,0:22]
X_train, X_test, y_train, y_test = model_selection.train_test_split(X, y, test_size=0.3, random_state=0)
print(X_train,y_train)
print(X_test,y_test)
#**************** END *******************