混淆矩阵+F1score+ROC曲线+AUC

本文介绍了数据挖掘中的评价指标,包括混淆矩阵、F1分数、ROC曲线及其对应的AUC值。通过实例解析了各个指标的计算方法,如准确率、精准率和召回率,并提供了Python的sklearn库用于计算这些指标。
摘要由CSDN通过智能技术生成

评价指标1

以下四个可以这样理解,第一个字母代表你预测的对错T/F,第二个字母代表你预测的是正还是负P/N。例如TP=你预测的是正的,且预测对了。
真正例/真阳性(TP):预测为正,实际为正,预测对了。
真负例/真阴性(TN):预测为负,实际为负,预测对了。
假正例/假阳性(FP):预测为正,实际为负,预测错了。
假负例/假阴性(FN):预测为负,实际为正,预测错了。

所谓正负指的是,对某一类,你认为它是这一类或不是,也就是说每一类都需要计算一遍这四个指标。

例子

比如三类问题
你预测的:

1 2 3 1 2 3 1 2 3 1

实际分类:

1 1 2 2 2 3 3 3 3 3

对于1类:
TP = 1, TN = 5, FP = 3, FN = 1
对于其它两类同理

评价指标2

准确率(accuracy):(TP + TN) / (TP + TN + FP + FN),分母就是你预测的全部数据P’+N’
精准率(precision):TP / (TP + FP),分母就是你预测的全部正数据P’
召回率(recall):TP / P,真实数据中全部正数据

其中P’和N’表示你预测的正负类,P和N表示真实正负类。往往预测数据与真实数据数量相等,P’和P不需要区分,但如果预测数量与真实数量不等,则需要区分。

例子

接着上面的例子:
总的准确率:
accuracy = 4 / 10 = 0.4
对于1类:
precision = 1 / (1 + 3) = 0.25
recall = 1 / 2 = 0.5
其余两类同理

混淆矩阵

就是把上面几个值组合一下显示到矩阵中

真实\预测 合计
TP FN P
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值