评价指标(分类指标)知识笔记

本文详细介绍了分类问题中的评价指标,包括精度、召回率、精确率、F1值、ROC-AUC等,并通过实例分析了它们的优缺点和适用场景。特别强调了在样本不平衡时,AUC作为评价标准的重要性,以及ROC曲线和PR曲线的区别与联系。
摘要由CSDN通过智能技术生成

评价指标(分类指标)

对学习器的泛化性能进行评估,不仅仅需要有效可行的实验估计方法,还需要有衡量模型泛华能力的评价标准,这就是性能度量。我们通常会根据不同的业务选出适合的业务指标。

评价指标大概有

1、回归的有:RMSE(平方根误差)、MAE(平均绝对误差)、MSE(平均平方误差)、Coefficient of determination (决定系数)。

2、分类的有:精度、召回率、精确率、F值、ROC-AUC 、混淆矩阵、PRC。

3、聚类的有:兰德指数、互信息、轮廓系数。

分类

1.精度(Accuracy)

​ 意义:被正确分类的样本占总样本的比。

img

​ 优点:简单

​ 缺点:精度只是简单地计算出比例,但是没有对不同类别进行区分。因为不同类别错误代价可能不同。例如:判断这个病人是不是病危,如果不是病危错误判断为病危,那只是损失一点医务人员的时间和精力,如果是把病危的人判断为非病危状态,那损失的就是一条人命。他们之间存在重要性差异,这时候就不能用精度。对于样本不均衡的情况,也不是用精度来衡量。例如:有A类1000个,B类5个,如果我把这1005个样本都预测成A类,正确率=1000/1005=99.5%。

  1. 混淆矩阵

*混淆矩阵(Confusion Matrix)*

预测为正样本 预测为负样本
标签为正样本 TP(True Positive对的正样本) FN(false Negative错的负样本)
标签为负样本 FP(False Positive错的正样本) TN(true Negative 对的负样本)

(1).True Postitve Rate(真正率):正样本中被预测对比例。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值