一个很有用的函数,可以对数据的标签自动划分训练集测试集,因为总是记不住,写个博客记录下。
这个函数是在sklearn中的model_selection模块中,名字叫train_test_split (好气-.-每次都记不住这几个词!!!)
返回的值的顺序是(训练集,测试集,训练集label,测试集label) (好气-.-还是每次都记混淆!!!)
示例:
data = sio.loadmat('./Data/B1_1.mat')['H_data']
label = np.ones(len(data))
X_train,X_test,Y_train,Y_test = train_test_split(data,label,test_size=0.3,random_state=0)
test_size是划分测试集的比例,random_state是随机种子
至于随机种子,呃.....这个坑先留着,日后再填。