多分类混淆矩阵详解

最新推荐文章于 2025-03-07 16:30:53 发布

肥猪猪爸

最新推荐文章于 2025-03-07 16:30:53 发布

阅读量2.9k

点赞数 24

分类专栏：人工智能大数据文章标签：分类矩阵人工智能 python 机器学习混淆矩阵模型评估

本文链接：https://blog.csdn.net/weixin_37522117/article/details/139530340

版权

人工智能同时被 2 个专栏收录

64 篇文章

订阅专栏

大数据

34 篇文章

订阅专栏

⭐️ 前言

在机器学习和数据科学中，混淆矩阵（Confusion Matrix）是一个重要的工具，用于评估分类模型的性能。特别是在多分类问题中，混淆矩阵能够清晰地展示模型在每个类别上的预测结果。以下是对多分类混淆矩阵的详细解释。

在这里插入图片描述

⭐️ 1. 混淆矩阵的基本概念

混淆矩阵是一个N x N的矩阵（N代表类别数量），它的每一行代表一个实际类别，每一列代表一个预测类别。矩阵中的每个元素C[i][j]表示实际为第i类但被预测为第j类的样本数量。

在多分类问题中，混淆矩阵的结构如下：

真实值\预测值	Predicted: 0	Predicted: 1	…	Predicted: N-1
Actual: 0	C[0][0]	C[0][1]	…	C[0][N-1]
Actual: 1	C[1][0]	C[1][1]	…	C[1][N-1]
…	…	…	…	…
Actual: N-1	C[N-1][0]	C[N-1][1]	…	C[N-1][N-1]

⭐️ 2. 混淆矩阵中的重要指标

真正例（True Positives, TP）：实际为正例且预测为正例的样本数量，对应矩阵的对角线元素C[i][i]。

假正例（False Positives, FP）：实际为负例但预测为正例的样本数量，对应矩阵非对角线上的元素C[i][j]（i ≠ j）。

真负例（True Negatives, TN）：在多分类问题中通常不直接计算，但在二分类问题中用于表示实际为负例且预测为负例的样本数量。

假负例（False Negatives, FN）：实际为正例但预测为负例的样本数量，在多分类问题中，这通常表示被错误分类到其他类别的样本。

在这里插入图片描述

⭐️ 3. 从混淆矩阵计算评估指标

在这里插入图片描述

⭐️ 4. 使用Python计算混淆矩阵和评估指标

在Python中，我们可以使用sklearn.metrics模块来计算混淆矩阵和评估指标。以下是一个简单的示例：

from sklearn.metrics import confusion_matrix, accuracy_score, precision_score, recall_score, f1_score  
from sklearn.model_selection import train_test_split  
from sklearn.datasets import load_iris  
from sklearn.svm import SVC  
  
# 加载数据集  
iris = load_iris()  
X = iris.data  
y = iris.target  
  
# 划分数据集为训练集和测试集  
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)  
  
# 训练模型（这里使用SVM作为示例）  
clf = SVC(kernel='linear', C=1, random_state=42)  
clf.fit(X_train, y_train)  
  
# 对测试集进行预测  
y_pred = clf.predict(X_test)  
  
 # 计算混淆矩阵  
cm = confusion_matrix(y_test, y_pred)  
print("Confusion Matrix:")  
print(cm)  
  
# 计算准确率  
accuracy = accuracy_score(y_test, y_pred)  
print("Accuracy:", accuracy)  
  
# 计算每个类别的精准率、召回率和F1分数  
precision = precision_score(y_test, y_pred, average=None)  
recall = recall_score(y_test, y_pred, average=None)  
f1 = f1_score(y_test, y_pred, average=None)  

# 打印每个类别的精准率、召回率和F1分数  
print("Precision per class:", precision)  
print("Recall per class:", recall)  
print("F1 Score per class:", f1)  
  
# 如果你想获得一个全局的评估指标，可以计算它们的平均值
precision_avg = precision_score(y_test, y_pred, average='macro')  # 宏平均  
recall_avg = recall_score(y_test, y_pred, average='macro')  
f1_avg = f1_score(y_test, y_pred, average='macro')  
  
print("Macro average Precision:", precision_avg)  
print("Macro average Recall:", recall_avg)  
print("Macro average F1 Score:", f1_avg)


import seaborn as sns  
import matplotlib.pyplot as plt  
  
# 绘制混淆矩阵  
plt.figure(figsize=(10, 7))  
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues')  
plt.xlabel('Predicted')  
plt.ylabel('Truth')  
plt.show()

运行结果如下

Confusion Matrix:
[[10  0  0]
 [ 0  9  0]
 [ 0  0 11]]
Accuracy: 1.0
Precision per class: [1. 1. 1.]
Recall per class: [1. 1. 1.]
F1 Score per class: [1. 1. 1.]
Macro average Precision: 1.0
Macro average Recall: 1.0
Macro average F1 Score: 1.0