分类问题的评价指标：二分类【准确率（Accuracy）：用在数据均衡（每一类的样本数量相同）的数据集上】【精确率（Precision）】【召回率（Recall）】【F1】

u013250861

已于 2022-12-05 21:21:51 修改

阅读量6.8k

点赞数 2

分类专栏： # NLP/文本分类文章标签：分类机器学习人工智能二分类

于 2022-02-22 23:15:00 首次发布

本文链接：https://blog.csdn.net/u013250861/article/details/123079754

版权

34 篇文章 9 订阅

订阅专栏

在这里插入图片描述

一、混淆矩阵

对于二分类的模型，预测结果与实际结果分别可以取0和1。我们用N和P代替0和1，T和F表示预测正确和错误。将他们两两组合，就形成了下图所示的混淆矩阵（注意：组合结果都是针对预测结果而言的）。

由于1和0是数字，阅读性不好，所以我们分别用P和N表示1和0两种结果。变换之后为PP，PN，NP，NN，阅读性也很差，我并不能轻易地看出来预测的正确性与否。因此，为了能够更清楚地分辨各种预测情况是否正确，我们将其中一个符号修改为T和F，以便于分辨出结果。

在这里插入图片描述

在这里插入图片描述

准确率(Accuracy)：对于给定的测试数据集，分类器正确分类的样本数与总样本数之比。
$Accuracy=\cfrac{TP+TN}{TP+TN+FP+FN}=\cfrac{TP+TN}{总样本数量}$
精确率(Precision)**：精指分类正确的正样本个数（TP）占分类器判定为正样本的样本个数（TP+FP）的比例。
$Precision=\cfrac{TP}{TP+FP}=\cfrac{分类正确的正样本个数}{判定为正样本的样本个数}$
召回率(Recall)：召回率是指分类正确的正样本个数（TP）占真正的正样本个数（TP+FN）的比例。
$Recall=\cfrac{TP}{TP+FN}=\cfrac{分类正确的正样本个数}{全部真正的正样本个数}$
F1-Measure值：就是精确率和召回率的调和平均值。
$\begin{aligned}F1-Measure=\cfrac{2}{\cfrac{1}{Precision}+\cfrac{1}{Recall}}=\cfrac{2×Precision×Recall}{Precision+Recall}\end{aligned}$

每个评估指标都有其价值，但如果只从单一的评估指标出发去评估模型，往往会得出片面甚至错误的结论；只有通过一组互补的指标去评估模型，才能更好地发现并解决模型存在的问题，从而更好地解决实际业务场景中遇到的问题。

关注