分类器评价java实现_分类器评价指标

在分类器设计过程中,如何评价分类器至关重要,一个好的评价指标更有利于我们对分类模型进行优化;同时,好的分类器评价指标要求其充分反应出分类器对问题的解决能力,也更容易向使用者、客户展示交互。

在分类问题中,一个实例可能被判定为一下四种类型之一:

Ÿ     TP(True Positive):被模型预测为正的正样本;

Ÿ      FP(False Positive):被模型预测为正的负样本;

Ÿ      FN(False Negative):被模型预测为负的正样本;

ŸTN(True Negative):被模型预测为负的负样本;

由这四种类型可以得到一个混淆矩阵(Confusion Matrix):

Confusion Matrix

Predicted

Negative

Positive

Actual

Negative

TN

ŸFP

Positive

FN

TP

基于以上混淆矩阵,可以引申出一下指标进一步评价分类器性能:

准确率(Aaccuracy):对整个样本集的判定能力,即将正的判定为正、负的判定为负,A=(TP+TN)/(TP+FN+FP+TN);

灵敏度(Sensitivity):将正样本预测为正样本的能力,Sensitivity=TP/(TP+FN);

特异度(Specificity):将负样本预测为负样本的能力,Specificity=TN/(TN+FP);

ROC(Receiver Operating Charateristic):ROC的主要分析工具为画在ROC空间的曲线(如下图),横轴为1- Specificity,纵轴为Sensitivity。在分类问题中,一个阀值对应于一个特异性及灵敏度,并在ROC空间描出一个点P,当阀值连续移动时,P点也随即移动最终绘成ROC曲线。ROC良好的刻画了不同阀值对样本的分辨能力,也同时反应出对正例和对反例的分辨能力,方便使用者根据实际需求选用合适的阀值。一个好的分类模型要求ROC曲线尽可能靠近图形的左上角;

400fba788f827acd823791bfea317077.png

ROC曲线(图片引子维基百科)

AUC(Area Under roc Curve)值指处于ROC曲线下方的那部分面积大小;一个理想的分类模型其AUC值为1,通常其值在0.5至1.0之间,较大的AUC代表了分类模型具备较好的性能。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值