《百面机器学习》模型评估

最新推荐文章于 2024-01-22 18:44:45 发布

邦戈栗子

最新推荐文章于 2024-01-22 18:44:45 发布

阅读量161

点赞数 1

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42189368/article/details/89040921

版权

机器学习专栏收录该内容

32 篇文章 2 订阅

订阅专栏

没有测量，就没有科学。

-----门捷列夫

模型评估主要分为离线评估和在线评估两个阶段。

在模型评估过程中，分类问题、排序问题、回归问题往往需要使用不同的指标进行评估。在诸多的评估指标中，大部分指标只能片面地反映模型的一部分性能。如果不能合理地运用评估指标，不仅不能发现模型本身的问题，而且会得出错误的结论。

准确率（ Accuracy），精确率（ Precision），召回率（ Recall），均方根误差（ Root Mean Square Error， RMSE）

准确率是分类问题中最简单也是最直观的评价指标，但存在明显的缺陷。比如，当负样本占99%时，分类器把所有样本都预测为负样本也可以获得99%的准确率。所以，当不同类别的样本比例非常不均衡时，占比大的类别往往成为影响准确率的最主要因素。

以人脸检测与识别为例讲解相关指标：

- 真阳性（True Positive，TP）：指被分类器正确分类的正例数据

- 真阴性（True Negative，TN）：指被分类器正确分类的负例数据

- 假阳性（False Positive，FP）：将负类预测为正类数 (误检)

- 假阴性（False Negative，FN）：将正类预测为负类数（漏检）

准确率Accuracy =（TP+TN）/(TP+TN+FP+FN)

正检率 = TP/(TP+TN+FP+FN)

误检率 = FP/(TP+TN+FP+FN)

漏检率 = FN/(TP+TN+FP+FN)

precision = TP/（TP+FP）；

Recall = TP/(TP+FN)=TP/P ；

正样本对总数P = TP+ FN

负样本对总数 N = TN+ FP

ROC曲线的横坐标为：FPR = FP/N，纵坐标为：TPR=TP/P

1. 误识率(False Accept Rate, FAR)：这是将其他人误作指定人员的概率;

2. 拒识率(False Reject Rate , FRR)：这是将指定人员误作其它人员的概率；

计算方法：设定一个分数阈值T，FAR=非同人分数>T/非同人比较的次数，FRR=同人比较分数<T/同人比较的次数，即FAR（False Accept Rate）和FRR都是一个关于T的函数；

一般，FAR=0.001时，FRR的值作为参考，值越小，性能越好。

误识率FAR=错误识别为正样本数/负样本对总数= FP /N；FAR=FPR

拒识率FRR=错误识别为负样本数/正样本对总数= FN/P；FRR=1-TPR

3. 采用的阈值不同，FAR和FRR这两个指标也不相同，一般情况下，误识率（FAR）随着阈值放宽条件而增大，拒识率（FRR）随着阈值放宽条件而减小。因此，可以采用等错率(Equal Error Rate, EER)作为性能的指标，EER是拒识率和误识率的一个平衡点(FAR=FRR)，等错率能够取到的值越低，表示算法的性能越好；

4. AUC值作为算法好坏的评判标准，面积越大，表示分类性能越好

MAP

precision = TP/（TP+FP）；

Recall = TP/(TP+FN)=TP/P ；

把每种recall对应最大的precision求和取平均即AP。

笔记于《百面机器学习》

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《百面机器学习》模型评估

没有测量，就没有科学。 -----门捷列夫模型评估主要分为离线评估和在线评估两个阶段。在模型评估过程中，分类问题、排序问题、回归问题往往需要使用不同的指标进行评估。在诸多的评估指标中，大部分指标只能片面地反映模型的一部分性能。如果不能合理地运用评估指标，不仅不能发现模型本身的问题，而且会得出...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。