二分类问题混淆矩阵和相关参数

混淆矩阵

预测的类
+
-
实际的类
+
f++(TP) f + + ( T P )
f+(FN) f + − ( F N )
-
f+(FP) f − + ( F P )
f(TN) f − − ( T N )

相关术语:

TPFN

  • 真正 (true positive ,TP) ( t r u e   p o s i t i v e   , T P ) 或者 f++ f + + ,对应于被分类模型正确预测的正样本数。
  • 假负 (false negative ,FN) ( f a l s e   n e g a t i v e   , F N ) 或者 f+ f + − ,对应于被分类模型错误预测为负类的正样本数
  • 假正 f(alse positive ,FP) f ( a l s e   p o s i t i v e   , F P ) 或者 f+ f − + ,对应于被分类模型错误预测为正类的负样本数
  • 真负 (ture negative ,TN) ( t u r e   n e g a t i v e   , T N ) 或者 f f − − ,对应于被分类模型正确预测的负样本数

其他术语

真正率(true positive rate,TPR)

或者称灵敏度(sensitivity)
定义为被模型正确预测的正样本的比例,即:

TPR=TPTP+FN T P R = T P T P + F N

真负率(ture negative rate,TNR)

或者称特指率(specificity)
定义为被模型正确预测的负样本的比例,即:

TNR=TNTN+FP T N R = T N T N + F P

假正率(false positive rate,FPR)

定义为被预测为正类的负样本比例,即:

FPR=FPTN+FP F P R = F P T N + F P

假负率(false negative rate,FNR)

定义为被预测为负类的正样本的比例,即:

FNR=FNTP+FN F N R = F N T P + F N

召回率(recall)

度量被分类器正确预测的正样本的比例,即:

recall=TPTP+FN r e c a l l = T P T P + F N

精度(precision)

精度确定分类器断言为正类的部分实际为正类记录所占的比例,即:

precision=TPTP+FP p r e c i s i o n = T P T P + F P

F1 F 1 度量

精度和召回率可以合并为一个度量,称为 F1 F 1 度量
原则上 F1 F 1 为召回率和精度的调和均值

F1=21r+1p F 1 = 2 1 r + 1 p

一个高的 F1 F 1 度量值确保精度和召回率都比较高。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值