分类之混淆矩阵(Confusion Matrix)

l8947943

已于 2022-10-28 08:42:00 修改

阅读量1.4k

点赞数

分类专栏：机器学习文章标签：分类矩阵机器学习

于 2022-10-27 19:11:40 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/l8947943/article/details/127558164

版权

机器学习专栏收录该内容

11 篇文章 6 订阅

订阅专栏

1. 写在前面

为什么时隔多年又再做一次混淆矩阵的整理，TMD就是每次用的时候要自己回过头查一遍，老是记不住，为了打好基础，再次进行梳理。

2. 为什么会有混淆矩阵

我们简单的分类衡量模型的好坏，其实正常使用均方误差就行了，如下：

$E(f;D)=\frac{1}{m}\sum_{i=1}^{m}(f(x_i)-y_i)^2$

其次就是错误率：

$E(f;D)=\frac{1}{m}\sum_{i=1}^{m}\prod(f(x_i)-y_i)^2$

那么精度就是1-错误率喽：

$a cc (f; D) = 1 - E (f; D)$

但是，还有更麻烦的需求，什么需求？我们后面再说！先看混淆矩阵。
在这里插入图片描述

TP：预测结果是正例(Positive)，而且真实情况是正例，那么模型预测正确，即预测为True，故用True Positive = TP表示。
FN：预测结果是反例(Negative)，而且真实情况是正例，那么模型预测错误，即预测为False，故用False Negative = FN表示。
FP：预测结果是正例(Positive)，而且真实情况是反例，那么模型预测错误，即预测为False，故用False Positive = FN表示。
TN：预测结果是反例(Negative)，而且真实情况是反例，那么模型预测正确，即预测为True，故用True Negative = TN表示。

综上：混淆矩阵的含义终于搞清楚了。

3. 那么衍生出来什么需求？

借用周志华老师的西瓜书：
模型预测了10个好瓜，但是其中真正的好瓜有多少？

在此用到了查准率：
$P=\frac{TP}{TP +FP}$

有20个好瓜，但是模型只查出了10个好瓜？
在此则用到的被称为查全率：
$R=\frac{TP}{TP +FN}$

4. 再次衍生出F1

什么是F1，就是P和R的调和平均，即
在这里插入图片描述
如果对P和R侧重不同，则更可以通过调权进行处理。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
分类之混淆矩阵(Confusion Matrix)

为什么时隔多年又再做一次混淆矩阵的整理，TMD就是每次用的时候要自己回过头查一遍，老是记不住，为了打好基础，再次进行梳理。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

l8947943 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。