二分类和混淆矩阵

二值分类器(Binary Classifier)是机器学习领域中应用最为广泛的分类器之一。在二分类的应用场景下,我们可以根据真实类别和预测类别的不同组合,将样本划分为如下四类:

  • 真正类(True Positive,简称 TP):实际为正类,且被模型预测为正类的样本。
  • 假正类(False Positive,简称 FP):实际为负类,但被模型预测为正类的样本。
  • 真负类(True Negative,简称 TN):实际为负类,且被模型预测为负类的样本。
  • 假负类(False Negative,简称 FN):实际为正类,但被模型预测为负类的样本。

显然,这四类样本是没有交集的,并且 TP+FP+TN+FN=样本总数。其中第一类和第三类是预测正确的样本,第二类和第四类是预测错误的样本。我们把样本实际为负类,但被模型预测为正类的错误称为误报(也称第 Ⅰ 类错误);把样本实际为正类,但被模型预测为负类的错误称为漏报(也称第 Ⅱ 类错误)。

TP、FP、TN 和 FN 这四类样本,一起构成了一个混淆矩阵(confusion matrix),如图 1 所示。

二分类结果的混淆矩阵

二分类结果的混淆矩阵

图 1:二分类结果的混淆矩阵

 

本质上,混淆矩阵会把实际样本分类值(true class)和模型预测分类值(predicted class)进行联列表分析。在二分类问题中,通常我们会把样本分为正类(或正例,常用“1”表示)和负类(负例,常用“-1”表示)。

对于分类而言,评估分类器最简单、最直接的标准就是分类准确率(Accuracy),即分类正确的样本数占总样本数的比例:

Accuracy=ncorrect/ntotal

针对二分类,这个准确率可具体表示为:

Accuracy=(TP+TN)/ntotal

但单纯用准确率来刻画分类算法的性能,不够严谨。有时我们还需要借助诸如查全率、查准率和 F1 分数更为细致地来评估性能。

  • 0
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: MLP多分类混淆矩阵是一种用于评估多类分类模型性能的工具。混淆矩阵是一个二维的表格,其中行表示实际的类别标签,列表示模型预测的类别标签。 混淆矩阵的对角线上的元素表示被正确分类的样本数目,而非对角线上的元素表示被错误分类的样本数目。通过分析混淆矩阵,我们可以获得各个类别的分类准确性,以及模型在不同类别上的分类性能。 在多分类问题中,混淆矩阵的大小为N x N,其中N表示类别的个数。例如,对于一个三分类问题,混淆矩阵的大小为3 x 3。混淆矩阵的行表示实际类别,列表示预测类别。 举个例子,假设我们有一个三分类问题,类别分别为A、B、C。混淆矩阵可能如下所示: ``` 预测A 预测B 预测C 实际A 10 2 3 实际B 1 9 4 实际C 2 1 8 ``` 通过这个混淆矩阵,我们可以得到以下信息: 1. 类别A的样本有10个被正确分类,2个被错误分类为B,3个被错误分类为C。 2. 类别B的样本有9个被正确分类,1个被错误分类为A,4个被错误分类为C。 3. 类别C的样本有8个被正确分类,2个被错误分类为A,1个被错误分类为B。 通过混淆矩阵,我们可以计算出各个类别的精确度、召回率和F1-score等指标,这些指标能够帮助我们评估和优化多分类模型的性能。 ### 回答2: 混淆矩阵是评估多类别分类模型性能的重要工具。它展示了模型在每个类别上的预测结果与真实结果的对比情况。 混淆矩阵是一个N×N的矩阵,其中N表示类别的数量。对于每个类别,矩阵的行代表真实类别,列代表预测类别。矩阵的每个元素表示属于真实类别i但被错误地预测为类别j的样本数。 以三类分类为例,混淆矩阵可以表示为: 预测类别1 预测类别2 预测类别3 真实类别1 TP FN FN 真实类别2 FN TP FN 真实类别3 FN FN TP 其中,TP表示真正例(True Positive),即被正确地预测为正例的样本数;FN表示假反例(False Negative),即被错误地预测为负例的样本数。 通过观察混淆矩阵,我们可以计算出一些有用的评估指标,如准确率、召回率、精确率和F1分数。准确率表示正确预测的样本数量占总样本数的比例;召回率表示被正确地预测为正例的样本数量占真实正例的比例;精确率表示被正确地预测为正例的样本数量占预测为正例的样本数量的比例;F1分数综合考虑了精确率和召回率,是一个综合评估指标。 混淆矩阵的分析可以帮助我们了解模型在各个类别上的性能表现,进而进行模型调整或改进。通过对比不同类别的预测结果,我们可以确定模型在某些类别上是否存在偏好或偏差,从而采取相应的措施来提高模型的泛化能力。 综上所述,混淆矩阵是评估MLP多分类模型性能的有效工具,可以用于计算各种有用的评估指标,并帮助我们进一步优化模型。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值