python绘制混淆矩阵matrix总结以及相关函数详解

本文旨在全面介绍python绘制混淆矩阵的全过程,并分享相应函数的全部可选参数,之前在查相关资料的时候,发现站内很多人写相关的分享资料的时候,完全只是照搬官网的参数列表并解释每个参数是啥意思--------可你有没有想过:对于小白而言,知道啥意思还不够,还得知道怎么用呀!!!

1. 首先绘制混淆矩阵,首先你得有个矩阵来存放你的深度学习的结果(一般深度学习处理分类问题时需要绘制混淆矩阵来较为直观的反映结果),所以第一步,就是将你的预测值和实际值转换为混淆矩阵。

C1= confusion_matrix(test_y, gp_n,normalize='true') 
#True_label 真实标签 shape=(n,1);T_predict1 预测标签 shape=(n,1)

C1表示你用来装结构的混淆矩阵

confusion_matrix这个函数的功能就是用来把你的结果转换成混淆矩阵,具体怎么用呢,请看下面介绍:

首先,里面常用的参数主要就三个

第一个参数,我这里的示例用的是test_y,表示你结果的标签。

第二个参数,我这里的示例是gp_n,表示你分类给出的预测结果的标签。

(上述两个参数的格式,都是(n,1)格式,其中第一个n表示你数据集的标签的数量,如果你模型训练的结果不是这个格式,那也简单,直接转化就好了。)

一般来说,我们丢进模型的数据,输入和输出都是tensor类型的数据,所以一般首先先将其转换成数组,比如你的结果是分类结果gp,那么转换就是

gp_ = gp.detach().numpy()

然后再换成(n,1)格式,具体操作就是执行:

gp_n = gp.reshape(-1,1)

第三个参数 normalize,就是标准化的意思,true就表示执行标准化,false就是不执行。顾名思义,就是将你的矩阵归一化,举个例子,一个2*2的矩阵

[[36],[64],

[55],[45]]

经过normalize之后,就会变成

[[0.36],[0.64],

[0.55],[0.45]]

说直白点就是把你原来的矩阵等比例变成行和列相加都等于1的形式

2.就是绘制混淆矩阵,这里是很多博文讲不明白的地方,他们都喜欢只列参数和含义,完全不告诉你咋用,或者他们就只给你一个示例,完了你想自己变更样式都不知道咋办,因为你完全不知道那个参数的可选值有哪些。

首先,先给你的矩阵加上具体的含义,就是展示你矩阵的每一行和每一列都是啥意义,这里需要用到两个列表

xtick=[]
ytick=[]

一般图方便,很多作者演示的时候就简单给里面填充数字,比如xtick=[’1‘,’2‘,’3‘……]有几个标签就填几个数。。。。。。这样太草率了,最好还是标清楚实际的物理含义,比如你作手势分类的时候,那你就应该给里面填手势的名称,xtick=[’gesture1‘,’gesture2‘,’gesture3‘……],这里的gesture只是代称,具体想叫啥你自己来定。

然后就是开始画图了,我这里只详细介绍常用的几个参数怎么用,至于其它的,如果有兴趣可以去看官方文档或者其它作者的博客。

plt.figure(figsize=(25.6, 14.4))
plt.tight_layout()

其中figsize=(25.6, 14.4)表示你想画的图片分辨率是多大,很多博客就给你举个例子,完了你看完也不知道自己图片该定多大合适。。。。。(这里我不得不吐槽一下)

里面的两个值,说简单点,就是对应的就是分辨率,只不过是放缩了一百倍,比如我举得这个例子,(25.6,14.4)就是设置的常用的笔记本电脑的标准2k分辨率,也就是2560*1440

sns.heatmap(C1_d,cmap='Blues',annot=True,annot_kws={"fontsize":16},linecolor='black',linewidths=0,cbar=False,xticklabels=xtick, yticklabels=ytick) #画热力图,annot=True 代表 在图上显示 对应的值, fmt 属性 代表输出值的格式,cbar=False, 不显示 热力棒

sns.heatmap这个函数就是主要的画图函数,里面的参数很多博客都已经写过了,我这里就不过多赘述了,只介绍一下我们会用到但是很多博客里没介绍到的。

第一个比较重要的就是annot_kws={"fontsize":16},这个就是用来自定义你矩阵图里面的数字的大小的。很多人不知道怎么调大小,就是因为不知道怎么用这个参数。

第二个就是linecolor和linewidth这俩参数,它俩表示的是画的那个矩阵图相邻两个块的边界的颜色和大小,如果不带这俩参数,默认就是没有边界。其实如果你字体大小控制的比较合适不要这俩也无所谓,但是如果你图看起来比较密的话,不搞个边界线,相邻的两个数可能看起来就是连着的,如果这俩数差别蛮大,那背景颜色倒是可以区分出来,要是数值上相差不大,那背景颜色看起来都一样,展示的时候很容易看起来是连着的数,最好加上吧,当然最终还是看个人审美。

不带边界:

带边界:

如上边两图所示,很明显,如果你类别很少,数字不紧凑的情况下,其实不带边界反而会好看一点,带边界主要是为了解决某些情况,你分类的类别很多,而且你方框里面的数字小数点后保留了蛮多位的时候,它显示的就会比较密,如果不带边界,就容易把两个数看成连着的。

最后
 

plt.xticks(fontsize=16)
plt.yticks(fontsize=16)
plt.savefig('matrix.jpg',bbox_inches = 'tight')
plt.show()

plt.xticks(fontsize=16)
plt.yticks(fontsize=16) 这俩句则表示的是设置的你的行和列的那些字的大小,就是前面提到的xtick=[]和ytick=[]这俩列表里面的内容的字体大小。fontsize的单位依然是像素。

(希望能对大家有帮助吧,我也是做这块的时候查资料发现大都货不对板。。。。。要么是标题党,要么是复制粘贴的别人的,创作不易,觉得有用的帮忙点个赞!)

  • 26
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: `confusion_matrix` 函数是 Scikit-learn 库中的一个评估分类模型性能的函数。它用于计算分类模型在测试集上的混淆矩阵,即真阳性(True Positive)、假阳性(False Positive)、真阴性(True Negative)、假阴性(False Negative)的数量。该函数的语法如下: ``` confusion_matrix(y_true, y_pred, labels=None, sample_weight=None, normalize=None) ``` 其中,参数含义如下: - `y_true`:测试集的真实标签; - `y_pred`:分类器在测试集上的预测标签; - `labels`:指定标签的值,可以是列表或者 None。如果为 None,则默认为所有不同的标签值; - `sample_weight`:每个样本的权重,可以是 None 或者数组。如果为 None,则每个样本权重相等; - `normalize`:指定混淆矩阵是否应该被规范化。如果为 None,则返回混淆矩阵中的元素数量。如果为 'true',则返回混淆矩阵中的元素比例。 该函数的返回值为混淆矩阵。例如,对于二分类问题,混淆矩阵如下: | | 预测正类 | 预测负类 | | ------- | -------- | -------- | | 真实正类 | TP | FN | | 真实负类 | FP | TN | 其中,TP 表示真正例数量,FN 表示假反例数量,FP 表示假正例数量,TN 表示真反例数量。 ### 回答2: confusion_matrix函数是在机器学习领域中常用的性能评估指标之一。它用于衡量分类模型的准确性和错误率,并提供了一个混淆矩阵,用于可视化模型的分类结果。 混淆矩阵是一个二维矩阵,通常是一个n×n的矩阵,其中n是分类的类别数。混淆矩阵的行表示实际类别,列表示预测类别。其中的每个元素表示在真实类别为行索引,预测类别为列索引的情况下,分类器的预测结果数量。 以二分类为例,混淆矩阵的模板通常如下所示: 预测为正类 预测为负类 实际为正类 TP FN 实际为负类 FP TN 其中,TP表示真实为正类,预测结果为正类的数量;FN表示真实为正类,预测结果为负类的数量;FP表示真实为负类,预测结果为正类的数量;TN表示真实为负类,预测结果为负类的数量。 通过混淆矩阵,可以计算出分类模型的不同性能指标,如准确率(accuracy)、精确率(precision)、召回率(recall)和F1-score等。 准确率:指分类器正确分类的样本数量占总样本数量的比例。计算方法为( TP + TN ) / ( TP + FP + FN + TN )。 精确率:指分类器预测为正类的样本中,真正为正类的比例。计算方法为 TP / ( TP + FP )。 召回率:指分类器正确预测为正类的样本占实际为正类的样本数量的比例。计算方法为 TP / ( TP + FN )。 F1-score:综合了精确率和召回率的一个综合评价指标,计算方法为 2 * ( 精确率 * 召回率 ) / ( 精确率 + 召回率 )。 混淆矩阵函数可以帮助我们更好地理解分类模型的性能,判断模型的健壮性和领域适应性。 ### 回答3: confusion_matrix函数是一种用于评估分类模型性能的工具。它是机器学习中常用的函数之一,可以通过对模型预测结果与真实标签进行比较,来计算出分类模型的准确率、精确率、召回率和F1值等指标。 该函数的输入是一个模型的预测结果和真实标签,它将根据这两个输入生成一个二维数组,称为混淆矩阵混淆矩阵的行代表真实的类别,列代表预测的类别。每个矩阵元素表示该类别的样本被预测为其他类别的数量。 在混淆矩阵的对角线上,即矩阵元素的行数和列数相同的位置,表示被正确分类的样本数量。而非对角线上的元素则表示被错误分类的样本数量。 通过混淆矩阵,我们可以计算出以下指标来评估模型性能: 1. 准确率(Accuracy):被正确分类的样本数量占所有样本数量的比例。 2. 精确率(Precision):在所有被模型预测为正类的样本中,真正为正类的比例。 3. 召回率(Recall):真正为正类的样本被模型预测为正类的比例。 4. F1值:精确率和召回率的调和平均值,综合考虑了模型的精确性和召回率。 混淆矩阵函数对模型的性能评估非常有帮助,能够帮助我们对分类模型的表现有更全面的了解。通过解读混淆矩阵,我们可以找出模型的优点和不足之处,进而对模型进行改进或者调整。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值