什么是混淆矩阵
在机器学习领域和统计分类问题中,混淆矩阵(英语:confusion matrix)是可视化工具,特别用于监督学习,在无监督学习一般叫做匹配矩阵。矩阵的每一列代表一个类的实例预测,而每一行表示一个实际的类的实例。之所以如此命名,是因为通过这个矩阵可以方便地看出机器是否将两个不同的类混淆了(比如说把一个类错当成了另一个)。
混淆矩阵(也称误差矩阵[1])是一种特殊的, 具有两个维度的(实际和预测)列联表(英语:contingency table),并且两维度中都有着一样的类别的集合。
说人话
就看看你的 test set 最后 预测的结果到底 有多少 预测对了,
多少 预测 错了。
而且 是 用一种 图像 的方式 ,而不是 上一篇 文章 里面 的 ,就看原始的 输出 概率数据。
代码编写
引入 必要的 包
定义混淆矩阵
画混淆 矩阵 的 代码, 直接从 sckit 官网拿过来的。
定义 坐标轴 的 label
开始画 吧
观察结果
x 横轴,就是预测 的label
y 竖轴,就是 test 样本真实 的 label
从坐上 ,到 右下的蓝色框,就是预测 对 的数量。
白色 的 框,包含了预测不对的那部分。