- cross_validate 交叉验证,cv为折数,score是验证折数据, cross_val_score
- kfold 交叉验证迭代器 LeaveOneOut ,LeavePOut
- StratifiedKFold k-fold 的变种,会返回 stratified(分层) 的折叠:每个小集合中, 各个类别的样例比例大致和完整数据集中相同。 StratifiedShuffleSplit 会返回直接的划分,比如: 创建一个划分,但是划分中每个类的比例和完整数据集中的相同。
from sklearn.model_selection import train_test_split,cross_val_score,cross_validate # 交叉验证所需的函数
from sklearn.model_selection import KFold,LeaveOneOut,LeavePOut,ShuffleSplit # 交叉验证所需的子集划分方法
from sklearn.model_selection import StratifiedKFold,StratifiedShuffleSplit # 分层分割
from sklearn.model_selection import GroupKFold,LeaveOneGroupOut,LeavePGroupsOut,GroupShuffleSplit # 分组分割
from sklearn.model_selection import TimeSeriesSplit # 时间序列分割
from sklearn import datasets # 自带数据集
from sklearn import svm # SVM算法
from sklearn import preprocessing # 预处理模块
from sklearn.metrics import recall_score # 模型度量
iris = datasets.load_iris() # 加载数据集
print(‘样本集大小:’,iris.data.shape,iris.target.shape)
=========数据集划分,训练模型
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, te