sklearn---分类模型评估

最新推荐文章于 2024-07-03 10:55:05 发布

番茄被人吃了

最新推荐文章于 2024-07-03 10:55:05 发布

阅读量1k

点赞数

分类专栏： sklearn 文章标签： sklearn 分类评估

本文链接：https://blog.csdn.net/weixin_42343616/article/details/81584360

版权

sklearn 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

前几天刚学了sklearn的分类，接下来就说说我的学习笔记
1、交叉验证最简单的方法
cross_val_score函数

from sklearn.model_selection import cross_val_score
score = cross_val_score(clf, X_train, y_train, cv=5)
#X_train, y_train是训练数据集
#cv=5表示5次不同的分割

也可以传入一个交叉验证迭代器

from sklearn.model_selection import cross_val_score
from sklearn.model_selection import ShuffleSplit
cv = ShuffleSplit(n_splits=3, test_size=0.3, random_state=0)
score = cross_val_score(clf, X_train, y_train, cv=cv)
#n_splits是train/test对的组数，默认为10

还有Pipeline的用法

from sklearn.model_selection import cross_val_score
from sklearn.model_selection import ShuffleSplit
from sklearn.pipeline import make_pipeline
cv = ShuffleSplit(n_splits=3, test_size=0.3, random_state=0)
clf = make_pipeline(preprocessing, StandardScaler(), svm.SVC())
score = cross_val_score(clf, X_train, y_train, cv=cv)

2、多度量评估
返回一个字典，包含测试得分、讯练得分、拟合次数和得分次数

from sklearn.model_selection import cross_validate
from sklearn.metrics import recall_score
scoring = ['precision_macro', 'recall_macro']
scores = cross_validate(clf, X_train, y_train, scoring=scoring, cv=5, return_train_score=False)
#return_train_score的值通常设为0，不返回训练得分，减少计算量。

3、评估报告
返回准确率、召回率、f1和support
“
from sklean.metrics import classification_report
scores = classification_report(y_test, y_pre, digits=3)#digits：返回值的小数位数
“`
除了上面提到的方法，sklearn还提供了两种评估方法，但个人还是比较喜欢上面说到的几种方法。