机器学习（模型评估——各类交叉验证方法使用）

最新推荐文章于 2024-05-15 20:55:16 发布

濯君

最新推荐文章于 2024-05-15 20:55:16 发布

阅读量852

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/zzldm/article/details/100372758

版权

一：K折交叉验证

from sklearn.model_selection import cross_val_score
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression
iris = load_iris()
logreg = LogisticRegression()
scores = cross_val_score(logreg, iris.data, iris.target, cv=3)
print("Cross-validation scores: {}".format(scores))

在这里插入图片描述
注意有另一种类型StratifiedKFold

#添加随机化
from sklearn.model_selection import KFold
kfold = KFold(n_splits=3, shuffle=True, random_state=0)
cross_val_score(logreg, iris.data, iris.target, cv=kfold)

二：Leave-one-out cross-validation

#适用小数据集，大数据集很耗时间
from sklearn.model_selection import LeaveOneOut
loo = LeaveOneOut()
scores = cross_val_score(logreg, iris.data, iris.target, cv=loo)
print("Number of cv iterations: ", len(scores))
print("Mean accuracy: {:.2f}".format(scores.mean()))

三：Shuffle-split cross-validation

from sklearn.model_selection import ShuffleSplit
shuffle_split = ShuffleSplit(test_size=.5, train_size=.5, n_splits=10)
scores = cross_val_score(logreg, iris.data, iris.target, cv=shuffle_split)

四：Cross-validation with groups

from sklearn.model_selection import GroupKFold
# create synthetic dataset
X, y = make_blobs(n_samples=12, random_state=0)
# assume the first three samples belong to the same group,
# then the next four, etc.
groups = [0, 0, 0, 1, 1, 1, 1, 2, 2, 3, 3, 3]
scores = cross_val_score(logreg, X, y, groups, cv=GroupKFold(n_split

最低0.47元/天解锁文章

濯君

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习（模型评估——各类交叉验证方法使用）

一：K折交叉验证from sklearn.model_selection import cross_val_scorefrom sklearn.datasets import load_irisfrom sklearn.linear_model import LogisticRegressioniris = load_iris()logreg = LogisticRegression()...
复制链接

扫一扫