【二分类问题】通过混淆矩阵计算宏平均、微平均与weighted

最新推荐文章于 2024-05-13 18:58:40 发布

啥都不懂的鳄鱼

最新推荐文章于 2024-05-13 18:58:40 发布

阅读量1.3k

点赞数 3

文章标签：机器学习数据分析 python

本文链接：https://blog.csdn.net/m0_53119847/article/details/117532602

版权

最近在做二分类问题的评估时陷入深思

面对着sklearn中颇为直接的函数：precision_score(y_true,y_pred,labels=None,pos_label=1,average='binary',sample_weight=None)

emmm...虽然是二分类问题，但把average参数改了会发生什么事情呢？会得出很多值，这些值都源于眼前唯一的混淆矩阵。于是我比对着混淆矩阵，结合各位大神的文字思路得出单个混淆矩阵计算宏平均、微平均与weighted指标的公式，在此做个学习记录。

		Hypothesized class
		0	1
True class	0	True Negatives	False Positives
True class	1	False Negatives	True Positives

上述混淆矩阵没有反！！！网上有很多关于混淆矩阵的说法，我看了一下confusion_matrix输出的结果是这个没错，和这个相反的矩阵是因为：真实类别和预测类别反了，0和1的位置也跟着反，总体来说大家是一样的道理。

公式如下：（就拿精准率说事了，召回率同理）

宏平均精确率（macro） $=(\frac{TN}{TN+FN}+\frac{TP}{TP+FP})/2$
微平均精确率（micro） $=\frac{TP+TN}{TP+TN+FP+FN}$

weighted精确率 $=\frac{TN+FP}{TP+TN+FP+FN}*\frac{TN}{TN+FN}+\frac{FN+TP}{TP+TN+FP+FN}*\frac{TP}{TP+FP}$

以上为average参数的几个计算方法。通过公式确实可以看出来，精确率就是直接看猜到真为正的正类在所有预测正类中占的比例；宏平均精确率会做简单的算术平均，把猜到真为负的负类在所有预测为负类中所占的比例考虑进去，但是没有考虑每一类样本的比重；啊没错，微平均精确率此时就是准确率；weighted会更加注重每一类样本提供的话语权，是做了加权平均的方法，对于数据集类别不平衡问题感觉weighted会更合适。不过具体问题具体分析，查准查全鱼和熊掌不可兼得！

参考文章：https://blog.csdn.net/qq_41289920/article/details/104414878

https://www.cnblogs.com/robert-dlut/p/5276927.html

啥都不懂的鳄鱼

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
【二分类问题】通过混淆矩阵计算宏平均、微平均与weighted

最近在做二分类问题的评估时陷入深思面对着sklearn中颇为直接dprecision_score(y_true, y_pred, labels=None, pos_label=1, average='binary', sample_weight=None)
复制链接

扫一扫