混淆矩阵

最新推荐文章于 2023-08-08 10:36:08 发布

Andy_shenzl

最新推荐文章于 2023-08-08 10:36:08 发布

阅读量680

点赞数 1

分类专栏：机器学习文章标签：混淆矩阵二分类预测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Andy_shenzl/article/details/81810986

版权

机器学习专栏收录该内容

47 篇文章 13 订阅

订阅专栏

在机器学习的二分类算法中，

对于数据测试结果有下面4种情况，

TP(TruePositive): 预测为正，实际为正

FN(FalseNegative): 预测为负，实际为负

TN(FalsePositive):预测为正，实际为负

FP(TrueNegative): 预测为负，实际为正

精确率、准确率：Accuracy=(TP+TN)/(TP+TN+FN+FP)

精准率、查准率： P = TP/ (TP+TN)

召回率、查全率： R = TP/ (TP+FP)

真正例率(同召回率、查全率)：TPR = TP/ (TP+FN)

假正例率：FPR=FP/ (FP+TN)

F1-score: 2*TP/(2*TP + FP + FN）

我们可以综合总体准确率和召回率的结果来判定模型的拟合优度。

PS：之所以不看总体准确率，而加入召回率，是因为大部分数据中0,1的分布是不均衡的，

e.g.

Accuracy=(TP+TN)/(TP+TN+FN+FP)=(9800+0)/(9800+100+100+0)=98%

98%的准确率已经相当高了，但是你会发现TP是0，我们的主要任务就是预测100个positive数据，结果一个都没预测出来，就算是98%的准确率模型也是没有用的，所以这里加入了召回率，

上面例子里召回率： R = TP/ (TP+FP)=0/(0+100)=0，所以模型无效。

通常情况下，我们可以通过总体准确率和召回率综合来衡量模型的有效性。

PS：当然机器学习除了加入召回率这个数据外，其实还有很多其他方法来优化模型。（比如：对训练集进行交叉验证，对原始数据中不均衡的数据进行下采样或者上采样来平衡数据，以及加入正则化惩罚项。）

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
混淆矩阵

在机器学习的二分类算法中，对于数据测试结果有下面4种情况，TP(TruePositive): 预测为正，实际为正FN(FalseNegative): 预测为负，实际为负TN(FalsePositive):预测为正，实际为负FP(TrueNegative): 预测为负，实际为正精确率、准确率：Accuracy=(TP+TN)/(TP+TN+FN+FP)精准率、查准率： ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Andy_shenzl 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。