sklearn中混淆矩阵（confusion_matrix函数）的理解与使用

最新推荐文章于 2024-08-19 20:05:05 发布

秃头崽崽

最新推荐文章于 2024-08-19 20:05:05 发布

阅读量6.8w

点赞数 51

分类专栏：机器学习文章标签：算法机器学习 python 深度学习矩阵

本文链接：https://blog.csdn.net/sartinl/article/details/105844832

版权

机器学习专栏收录该内容

7 篇文章 2 订阅

订阅专栏

混淆矩阵

百度百科的定义：

混淆矩阵（confusion
matrix）也称误差矩阵，是表示精度评价的一种标准格式，用n行n列的矩阵形式来表示。具体评价指标有总体精度、制图精度、用户精度等，这些精度指标从不同的侧面反映了图像分类的精度。
在人工智能中，混淆矩阵（confusion
matrix）是可视化工具，特别用于监督学习，在无监督学习一般叫做匹配矩阵。在图像精度评价中，主要用于比较分类结果和实际测得值，可以把分类结果的精度显示在一个混淆矩阵里面。混淆矩阵是通过将每个实测像元的位置和分类与分类图像中的相应位置和分类相比较计算的。

在机器学习领域，混淆矩阵（confusion matrix），又称为可能性表格或是错误矩阵。
它是一种特定的矩阵用来呈现算法性能的可视化效果，通常是监督学习（非监督学习，通常用匹配矩阵：matching matrix）。
其每一列代表预测值，每一行代表的是实际的类别。
这个名字来源于它可以非常容易的表明多个类别是否有混淆（也就是一个class被预测成另一个class）。

简单的图解：（这张图真的非常好理解）
在这里插入图片描述

使用

官方文档中给出的用法是：
sklearn.metrics.confusion_matrix(y_true, y_pred, labels=None, sample_weight=None)

y_true: 是样本真实分类结果
y_pred: 是样本预测分类结果
labels：是所给出的类别，通过这个可对类别进行选择
sample_weight : 样本权重

实现例子：

from sklearn.metrics import confusion_matrix

y_true=[2,1,0,1,2,0]
y_pred=[2,0,0,1,2,1]

C=confusion_matrix(y_true, y_pred)

结果：

array([[1, 1, 0],
       [1, 1, 0],
       [1, 0, 2]])

下面是官方文档上的一个例子

y_true = ["cat", "ant", "cat", "cat", "ant", "bird"]
y_pred = ["ant", "ant", "cat", "cat", "ant", "cat"]
confusion_matrix(y_true, y_pred, labels=["ant", "bird", "cat"])

运行结果

array([[2, 0, 0],
       [0, 0, 1],
       [1, 0, 2]])