模型的交叉验证与混淆矩阵（二分类）

NaLan_2020

已于 2023-07-04 17:22:17 修改

阅读量411

点赞数 1

分类专栏：机器学习模型（Python实现）文章标签：矩阵分类线性代数

于 2023-07-04 17:05:43 首次发布

本文链接：https://blog.csdn.net/zhiziyi123/article/details/131492939

版权

本文详细介绍了交叉验证的概念，包括随机子抽样验证和K折交叉验证，强调了它们在分类模型评估中的作用。同时，文章深入探讨了混淆矩阵在评估二分类模型准确性中的应用，提到了precision、recall和F1分数作为关键指标，并讨论了ROC曲线及其重要性。

摘要由CSDN通过智能技术生成

一、交叉验证

交叉验证：就是在训练集中再抽出一部分当作测试，比如总数据本分成10分，训练集7份，测试集3份，在7份训练集中在抽出份当作测试，也就是说拿前6份训练时，把第7份当做测试。训练集有7份就要训练7次，这7份数据轮流当测试集，结果的准确性是这7次训练的平均值。

分类模型的交叉验证

from sklearn import datasets
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split

cancer = datasets.load_breast_cancer()
cancer_x = cancer.data
cancer_y = cancer.target

set(cancer_y)#y是二分类数据
#返回值
{
   0, 1}

#将数据集分为训练集和测试集
x_train1, x_test1, y_train1, y_test1 = train_test_split(cancer_x, cancer_y, test_size = 0.3) 

#将模型实例化
rf = RandomForestClassifier(criterion = 'entropy', max_depth = 3, n_estimators = 5, random_state = 300)

#训练模型
rf = rf.fit(x_train1, y_train1)

1、随机子抽样验证（Hold-Out Method）

from sklearn.model_selection import cross_val_score

#cv=3表示交叉验证做3次
#scoring='accuracy'适用于分类模型
cross_val_score(rf,x_train1,y_train1,cv=3

最低0.47元/天解锁文章

NaLan_2020

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
模型的交叉验证与混淆矩阵（二分类）

交叉验证：就是在训练集中再抽出一部分当作测试，比如总数据本分成10分，训练集7份，测试集3份，在7份训练集中在抽出份当作测试，也就是说拿前6份训练时，把第7份当做测试。训练集有7份就要训练7次，这7份数据轮流当测试集，结果的准确性是这7次训练的平均值。
复制链接

扫一扫

专栏目录