多分类算法常见的评估指标

最新推荐文章于 2024-06-08 23:07:34 发布

neverever24

最新推荐文章于 2024-06-08 23:07:34 发布

阅读量7k

点赞数 1

分类专栏：数据挖掘文章标签：机器学习算法 python

原文链接：https://github.com/datawhalechina/team-learning-data-mining/tree/master/HeartbeatClassification

版权

数据挖掘专栏收录该内容

1 篇文章 0 订阅

订阅专栏

datawhale组队学习task1--笔记记录

参考链接：https://github.com/datawhalechina/team-learning-data-mining/tree/master/HeartbeatClassification

多分类算法常见的评估指标如下：
其实多分类的评价指标的计算方式与二分类完全一样，只不过我们计算的是针对于每一类来说的召回率、精确度、准确率和 F1分数。

1、混淆矩阵（Confuse Matrix）

（1）若一个实例是正类，并且被预测为正类，即为真正类TP(True Positive )
（2）若一个实例是正类，但是被预测为负类，即为假负类FN(False Negative )
（3）若一个实例是负类，但是被预测为正类，即为假正类FP(False Positive )
（4）若一个实例是负类，并且被预测为负类，即为真负类TN(True Negative ）

第一个字母T/F，表示预测的正确与否；第二个字母P/N，表示预测的结果为正例或者负例。如TP就表示预测对了，预测的结果是正例，那它的意思就是把正例预测为了正例。

2.准确率（Accuracy）
准确率是常用的一个评价指标，但是不适合样本不均衡的情况，医疗数据大部分都是样本不均衡数据。
$Accuracy=\frac{Correct}{Total}\\ Accuracy = \frac{TP + TN}{TP + TN + FP + FN}$
3、精确率（Precision）也叫查准率简写为P

精确率(Precision)是针对预测结果而言的，其含义是在被所有预测为正的样本中实际为正样本的概率在被所有预测为正的样本中实际为正样本的概率，精确率和准确率看上去有些类似，但是是两个完全不同的概念。精确率代表对正样本结果中的预测准确程度，准确率则代表整体的预测准确程度，包括正样本和负样本。
$\frac{TP}{TP + FP}$
4.召回率（Recall）也叫查全率简写为R

召回率(Recall)是针对原样本而言的，其含义是在实际为正的样本中被预测为正样本的概率。
$\frac{TP}{TP + FN}$

下面我们通过一个简单例子来看看精确率和召回率。假设一共有10篇文章，里面4篇是你要找的。根据你的算法模型，你找到了5篇，但实际上在这5篇之中，只有3篇是你真正要找的。

那么算法的精确率是3/5=60%，也就是你找的这5篇，有3篇是真正对的。算法的召回率是3/4=75%，也就是需要找的4篇文章，你找到了其中三篇。以精确率还是以召回率作为评价指标，需要根据具体问题而定。

5.宏查准率（macro-P）

计算每个样本的精确率然后求平均值
${macroP=\frac{{1}}{{n}}{\mathop{ \sum }\limits_{{1}}^{{n}}{p\mathop{{}}\nolimits_{{i}}}}}$
6.宏查全率（macro-R）

计算每个样本的召回率然后求平均值
${macroR=\frac{{1}}{{n}}{\mathop{ \sum }\limits_{{1}}^{{n}}{R\mathop{{}}\nolimits_{{i}}}}}$
7.宏F1（macro-F1）
${macroF1=\frac{{2 \times macroP \times macroR}}{{macroP+macroR}}}$
与上面的宏不同，微查准查全，先将多个混淆矩阵的TP,FP,TN,FN对应位置求平均，然后按照P和R的公式求得micro-P和micro-R，最后根据micro-P和micro-R求得micro-F1

8.微查准率（micro-P）
${microP=\frac{{\overline{TP}}}{{\overline{TP} \times \overline{FP}}}}$
9.微查全率（micro-R）
${microR=\frac{{\overline{TP}}}{{\overline{TP} \times \overline{FN}}}}$
10.微F1（micro-F1）
${microF1=\frac{{2 \times microP\times microR }}{{microP+microR}}}$

neverever24

关注

1
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
多分类算法常见的评估指标

datawhale组队学习task1--笔记记录参考链接：https://github.com/datawhalechina/team-learning-data-mining/tree/master/HeartbeatClassification多分类算法常见的评估指标如下：其实多分类的评价指标的计算方式与二分类完全一样，只不过我们计算的是针对于每一类来说的召回率、精确度、准确率和 F1分数。1、混淆矩阵（Confuse Matrix）（1）若一个实例是正类，并且被预测为正类，即为真正类TP
复制链接

扫一扫