Sklearn之分类器性能评估

最新推荐文章于 2024-05-14 16:56:08 发布

半路转行程序员

最新推荐文章于 2024-05-14 16:56:08 发布

阅读量3k

点赞数 1

本文链接：https://blog.csdn.net/guihenao4010/article/details/85255064

版权

本文介绍了如何使用sklearn库评估分类器性能，包括准确率、精度、召回率、F1分数、P-R曲线、ROC曲线及AUC。强调在处理偏斜类别时，准确率可能不客观，而混淆矩阵、P-R曲线和ROC曲线能提供更全面的评估。同时，文章详细说明了如何计算和绘制这些指标。

摘要由CSDN通过智能技术生成

分类器的性能评估

在回归任务中，性能评估的方式较为简单，最常用的性能度量方式为均方误差（MSE）。

但是评估分类器就要比评估回归模型要困难很多，我们通常采用以下指标对分类器进行性能评估：
1、准确率、错误率（在评估倾斜类时，不是一个好指标）
2、精度（precision）、召回率（recall）、F1
3、ROC曲线、AUC

在进行性能评估时，依旧和回归模型一样采用交叉验证。
下面我们依次介绍如何在sklearn中使用上述三类指标进行分类器性能评估。

1、准确率

通常采用cross_value_score()这个函数，具体使用方法如下

from sklearn.model_selection import cross_val_score
cross_val_score(estimator, train_x, train_y, cv, scoring="accuracy")
其中，estimator即为我们要评估的分类器
cv为整数时，默认为KFold或StratifiedKFold。我们也可以自己设计交叉验证模式，具体见以前的博客。

但是准确率在处理偏斜类时，性能指标不客观。

混淆矩阵
评估分类器性能的更好方法就是混淆矩阵。

要计算混淆矩阵，需要先有一组预测才能将其与实际目标进行比较。当然可以通过测试集来进行预测，但是现在先不要动它（测试集最好留到项目最后，准备启动分类器时再

最低0.47元/天解锁文章

半路转行程序员

关注

1
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
Sklearn之分类器性能评估

分类器的性能评估在回归任务中，性能评估的方式较为简单，最常用的性能度量方式为均方误差（MSE）。但是评估分类器就要比评估回归模型要困难很多，我们通常采用以下指标对分类器进行性能评估：1、准确率、错误率（在评估倾斜类时，不是一个好指标）2、精度（precision）、召回率（recall）、F13、ROC曲线、AUC在进行性能评估时，依旧和回归模型一样采用交叉验证。下面我们依次介绍如何...
复制链接

扫一扫