分类器准确率评估

最新推荐文章于 2023-09-05 10:00:49 发布

KFPA

最新推荐文章于 2023-09-05 10:00:49 发布

阅读量6.8k

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/u010983763/article/details/78793528

版权

本文介绍了机器学习中的几个重要评估指标：accuracy_score（准确率）、recall_score（召回率）和ROC曲线。准确率是分类正确的样本比例，召回率关注正确识别出的正样本数。ROC曲线展示了模型识别正例与负例的能力，AUC值则量化了ROC曲线下的面积，是模型准确率的一种度量。

摘要由CSDN通过智能技术生成

accuracy_score

分类准确率分数是指所有分类正确的百分比。分类准确率这一衡量分类器的标准比较容易理解，但是它不能告诉你响应值的潜在分布，并且它也不能告诉你分类器犯错的类型。

形式：

sklearn.metrics.accuracy_score(y_true, y_pred, normalize=True, sample_weight=None)

normalize：默认值为True，返回正确分类的比例；如果为False，返回正确分类的样本数

示例：

[python]view plain copy 
   
 >>>import numpy as np  
 >>>from sklearn.metrics import accuracy_score  
 >>>y_pred = [0, 2, 1, 3]  
 >>>y_true = [0, 1, 2, 3]  
 >>>accuracy_score(y_true, y_pred)  
 0.5  
 >>>accuracy_score(y_true, y_pred, normalize=False)  
 2  

recall_score

召回率 =提取出的正确信息条数 /样本中的信息条数。通俗地说，就是所有准确的条目有多少被检索出来了。

形式：

klearn.metrics.recall_score(y_true, y_pred, labels=None, pos_label=1,average='binary', sample_weight=None)

参数average : string, [None, ‘micro’, ‘macro’(default), ‘samples’, ‘weighted’]

将一个二分类matrics拓展到多分类或多标签问题时，我们可以将数据看成多个二分类问题的集合，每个类都是一个二分类。接着，我们可以通过跨多个分类计算每个二分类metrics得分的均值，这在一些情况下很有用。你可以使用average参数来指定。

macro：计算二分类metrics的均值，为每个类给出相同权重的分值。当小类很重要时会出问题，因为该macro-averging方法是对性能的平均。另一方面，该方法假设所有分类都是一样重要的，因此macro-averaging方法会对小类的性能影响很大。

weighted:对于不均衡数量的类来说，计算二分类metrics的平均，通过在每个类的score上进行加权实现。

micro：给出了每个样本类以及它对整个metrics的贡献的pair（sample-weight），而非对整个类的metrics求和，它会每个类的metrics上的权重及因子进行求和，来计算整个份额。Micro-averaging方法在多标签（multilabel）问题中设置，包含多分类，此时，大类将被忽略。

samples：应用在multilabel问题上。它不会计算每个类，相反，它会在评估数据中，通过计算真实类和预测类的差异的metrics，来求平均（sample_weight-weighted）

average：average=None将返回一个数组，它包含了每个类的得分.