python:使用sklearn 计算 precision、recall、F1 score(多分类)

目录

参考:

0. 评估指标

1. 使用sklearn计算accuracy(accuracy_score)、混淆矩阵(confusion_matrix)

2. 使用sklearn计算精确率precision、召回率recall、F1 score


参考:

https://blog.csdn.net/kan2281123066/article/details/103237273  代码:利用sklearn 计算 precision、recall、F1 score

https://blog.csdn.net/blythe0107/article/details/75003890  代码:sklearn的precision_score, recall_score, f1_score使用

 

https://blog.csdn.net/Urbanears/article/details/105033731  二分类和多分类问题下的评价指标详析(Precision, Recall, F1,Micro,Macro)

https://blog.csdn.net/wf592523813/article/details/95202448  二分类和多分类问题的评价指标总结

 

https://zhuanlan.zhihu.com/p/147663370  知乎:多分类模型Accuracy, Precision, Recall和F1-score的超级无敌深入探讨

https://zhuanlan.zhihu.com/p/59862986  知乎:详解sklearn的多分类模型评价指标

https://www.zhihu.com/question/51470349  知乎:对多分类数据的模型比较选择,应该参考什么指标?

 

0. 评估指标

  • 精确度:precision,正确预测为正的,占全部预测为正的比例,TP / (TP+FP)
  • 召回率:recall,正确预测为正的,占全部实际为正的比例,TP / (TP+FN)
  • F1-score:精确率和召回率的调和平均数,2 * precision*recall / (precision+recall)


1. 使用sklearn计算accuracy(accuracy_score)、混淆矩阵(confusion_matrix)

    举的这个例子,标签label为5类,是个多分类问题

  • accuracy_score
  • confusion_matrix
from sklearn.metrics import confusion_matrix
from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score, recall_score, f1_score


actual = data3['label']     #真实的类别标签(data3是个dataframe,label是其中的一列)
predicted = data3['Label']  #预测的类别标签

# 计算总的精度
acc = accuracy_score(actual, predicted)
print(acc)

# 计算混淆矩阵
confusion_matrix(actual, predicted)


'''
输出结果:

0.8969907407407407
array([[1032,    1,    0,    0,    0],
       [   3,  965,   17,    0,   15],
       [   0,   10,   42,    0,    6],
       [   0,   11,    3,    0,    0],
       [   0,   98,  103,    0,  286]])
'''

2. 使用sklearn计算精确率precision、召回率recall、F1 score

     参数average有5个选项:{‘micro’微平均, ‘macro’宏平均, ‘samples’, ‘weighted’, ‘binary’},默认是default=’binary’二分类

p = precision_score(actual, predicted, average='micro')
p2 = precision_score(actual, predicted, average='macro')
p3 = precision_score(actual, predicted, average='weighted')
#p4 = precision_score(actual, predicted, average='samples')

r = recall_score(actual, predicted, average='micro')
r2 = recall_score(actual, predicted, average='macro')
r3 = recall_score(actual, predicted, average='weighted')

f1score = f1_score(actual, predicted, average='micro')
f1score2 = f1_score(actual, predicted, average='macro')
f1score3 = f1_score(actual, predicted, average='weighted')
#f1score4 = f1_score(actual, predicted, average='samples')

print(p,p2,p3)
print(r,r2,r3)
print(f1score,f1score2,f1score3)

'''
输出结果:
0.8969907407407407 0.614528783337003 0.9212413779093402
0.8969907407407407 0.6550877741326565 0.8969907407407407
0.8969907407407407 0.6041619746930149 0.8986671343868164
'''

 

### 回答1: 在sklearn中,可以使用`metrics`模块中的函数来计算F1recallprecision等指标。 以计算F1为例,假设有真实标签 `y_true` 和预测标签 `y_pred`,可以使用`f1_score`函数来计算F1值: ```python from sklearn.metrics import f1_score f1 = f1_score(y_true, y_pred) ``` 其中,`y_true`和`y_pred`都是一维的数组或列表,分别表示真实标签和预测标签,数组的每个元素对应一个样本的标签。 同样地,可以使用`recall_score`和`precision_score`函数来计算recallprecision值。例如: ```python from sklearn.metrics import recall_score, precision_score recall = recall_score(y_true, y_pred) precision = precision_score(y_true, y_pred) ``` 需要注意的是,在计算这些指标时,需要根据具体的业务场景和问题来选择合适的标签作为正类和负类,以及设定阈值等参数。 ### 回答2: sklearn是一个基于Python的机器学习库,提供了丰富的功能来进行数据预处理、特征选择、模型训练以及模型评估等任务。在sklearn中,我们能够使用它内置的函数来计算F1分数、召回率和精确度。 F1分数是综合了精确度和召回率的评估指标。精确度是指模型预测为正例的样本中真正为正例的比例,而召回率是指所有真实正例样本中被模型预测正确的比例。计算F1分数的目的是为了综合考虑精确度和召回率,以便更全面地评估模型的性能。 在sklearn中,我们可以使用`sklearn.metrics`模块中的`precision_recall_fscore_support`函数来计算F1分数、召回率和精确度。假设我们已经有真实标签y_true和模型预测的标签y_pred,我们可以按以下方式计算它们的F1分数、召回率和精确度: ```python from sklearn.metrics import precision_recall_fscore_support precision, recall, f1, _ = precision_recall_fscore_support(y_true, y_pred, average='binary') ``` 其中,`y_true`是真实的标签,`y_pred`是模型预测的标签。`average`参数用于指定如何计算多分类问题的F1分数、召回率和精确度,例如设置为'binary'表示只计算二分类问题的评估指标。 最后,我们可以通过打印上述变量来查看计算得到的F1分数、召回率和精确度: ```python print("F1 Score:", f1) print("Recall:", recall) print("Precision:", precision) ``` 上述代码将会输出F1分数、召回率和精确度的值。这样,我们就可以使用sklearn计算F1分数、召回率和精确度来评估我们的模型了。 ### 回答3: 在Scikit-Learn中,我们可以使用分类模型的评估函数来计算F1、召回率和精确度。 F1分数是用于衡量分类模型性能的指标,综合考虑了召回率和精确度。召回率是指被正确分类的正样本数量与所有实际正样本数量的比例,而精确度是指被正确分类的正样本数量与所有被模型判定为正样本的样本数量的比例。F1分数是召回率和精确度的调和平均数,用于平衡这两个指标。 在Scikit-Learn中,我们可以使用以下方法计算F1分数、召回率和精确度: - 使用模型的predict方法预测目标变量,并将预测结果与实际目标变量进行比较。 - 使用classification_report函数来计算F1分数、召回率和精确度。这个函数会根据实际目标变量和预测结果生成一个分类报告,其中包含了各个类别的F1分数、召回率和精确度。 - 使用f1_scorerecall_scoreprecision_score函数分别计算某个类别的F1分数、召回率和精确度。这些函数可以接受实际目标变量和预测结果作为参数,并返回相应的评估指标。 下面是一个简单的示例代码,演示如何使用Scikit-Learn计算F1分数、召回率和精确度: ```python from sklearn.metrics import classification_report, f1_score, recall_score, precision_score from sklearn.datasets import make_classification from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression # 生成一个二分类数据集 X, y = make_classification(n_samples=100, n_features=10, random_state=42) # 将数据集分为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 训练逻辑回归模型 model = LogisticRegression() model.fit(X_train, y_train) # 使用模型进行预测 y_pred = model.predict(X_test) # 计算F1分数、召回率和精确度 f1 = f1_score(y_test, y_pred) recall = recall_score(y_test, y_pred) precision = precision_score(y_test, y_pred) # 打印结果 print("F1 Score:", f1) print("Recall:", recall) print("Precision:", precision) # 生成分类报告 report = classification_report(y_test, y_pred) print(report) ``` 上述代码中,我们首先使用make_classification函数生成了一个二分类数据集。然后,我们将数据集分为训练集和测试集,并训练了一个逻辑回归模型。接着,我们使用模型进行预测,并计算F1分数、召回率和精确度。最后,我们打印了这些评估指标的值,并生成了一个分类报告。 通过上述方法,我们可以方便地计算F1分数、召回率和精确度,并评估分类模型的性能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

weixin_39450145

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值