分类器评价指标

混淆矩阵

实际样本预测结果
正例反例
正例TP(正预测为正,真正)FN(正预测为负,假负)
负例FP(负预测为正,假正)TN(负预测为负,真负)

1.准确率

Acc = \frac{TP+TN}{TP+TN+FP+FN}

TP和TN:表示预测正确的

2.1. 查准率:(精确率),预测为真占预测为真的百分比,表示对正样本的预测准确程度(预测为正/所有为正的预测)。

P=\frac{TP}{TP+FP}

2.2. 查全率:(召回率),实际样本为正中预测为正的比例,(预测为正/所有为正的样本)

Recall = \frac{TP}{TP+FN}

2.3 F1, 兼顾精确率和召回率

F1=\frac{2*P*R}{P+R} =\frac{2*TP}{ALLNUM+TP-TN}


3.1. 灵敏度,真正率(True Positive Rate , TPR),正样本预测正确的/正样本总数:

TPR=\frac{TP}{TP+FN}

3.2.特异性,真假率(True Negative Rate , TNR),负样本预测正确的/负样本总数:

TNR=\frac{TN}{TN+FP}

3.3. 假负率:(False Negative Rate , FNR),FNR=1-TPR, 正样本预测错误的/正样本总数。

3.4. 假正率: (False Positive Rate , FPR),FPR=1-TNR,负样本预测错误的/负样本总数。

灵敏度和特异度可以解决样本不平衡的问题,因为灵敏度只关注正样本检出率,特异度只关注负样本检出率。

3.5. ROC

纵坐标:真正率(灵敏度);

横坐标:假正率(1-特异性);

优势:

不受阈值选择影响;(ROC曲线各点是根据不同阈值绘制出的点)

正负样本不均匀不影响ROC评价;(灵敏度、特异度计算只分别关注正样本和负样本)

AUC=\frac{\sum_{insi\in pos}rank_{insi}-M*(M-1)/2 }{M*N}

\sum_{insi\in pos}rank_{insi}表示将pre递增排序后,正样本label对应的排序序号之和。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值