机器学习评估指标

PonyMzp

已于 2022-02-09 17:16:33 修改

阅读量1.1k

点赞数 1

分类专栏：机器学习文章标签：机器学习人工智能分类

于 2021-12-24 12:41:20 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/PonyMzp/article/details/122113465

版权

机器学习专栏收录该内容

3 篇文章

订阅专栏

针对二分类问题而言，会得到如下4个值，其中预测Positive-1和Negative-0，True和False描述预测的对错:

TP: True Positive 将正类预测为正类
FN: False Negative 将正类预测为负类
FP: False Positive 将负类预测为正类
TN: True Negative 将负类预测为负类

	正样本	负样本	合计
正样本	TP	FP	P(预测为正样本)
负样本	FN	TN	N(预测为负样本)
合计	T	F	T+F 或 P+N

混淆矩阵

直观呈现以上四种情况的样本数

真阳性率（True Positive Rate, TPR）

也叫敏感性(sensitivity)
TPR = TP/(TP+FN) = TP/T
真阳性率，即实际有病，但根据筛检被判为有病的百分比；

假阳性率（False Positive Rate, FPR）

也叫特异性(specificity)
FPR = FP/(FP + TN) = FP/F
假阳性率，即实际无病，但根据筛检被判为有病的百分比；

准确率(accuracy)

准确率是针对样本而言的，标志预测正确样本占所有样本的比例。
accuracy = (TP+TN)/(TP+FN+FP+TN)
解释：预测正确包括两种可能，一种就是把正类预测为正类(TP)，另一种就是把负类预测为负类(TN)。
在不平衡分类问题中难以准确度量：比如98%的正样本只需全部预测为正即可获得98%准确率。

精确率(precision)

也叫查准率
精确率是针对预测结果而言的，表示预测为正的样本中有多少是真正的正样本。
precision = TP/(TP+FP) = TP/P
解释：预测为正就有两种可能，一种就是把正类预测为正类(TP)，另一种就是把负类预测为正类(FP)。

召回率(recall)

也叫查全率
召回率是针对样本而言的，它表示的是样本中的正例有多少被预测正确了。
recall = TP/(TP + FN) = TP/T
解释：样本为正有两种可能，一种是把原来的正类预测成正类(TP)，另一种就是把原来的正类预测为负类(FN)。

ROC曲线(Receiver Operating Characteristic Curve)

在这里插入图片描述
ROC曲线的横坐标为假阳性率（False Positive Rate, FPR），纵坐标为真阳性率（True Positive Rate, TPR）

ROC曲线的4个点和1条线
- 第一个点，(0,1)，即FPR=0,TPR=1，这意味着无病的没有被误判，有病的都全部检测到，这是一个完美的分类器，它将所有的样本都正确分类。
- 第二个点，(1,0)，即FPR=1，TPR=0，类似地分析可以发现这是一个最糟糕的分类器，因为它成功避开了所有的正确答案。
- 第三个点，(0,0)，即FPR=TPR=0，即FP（false positive）=TP（true positive）=0，没病的没有被误判但有病的全都没被检测到，即全部选0
- 类似的，第四个点（1,1），分类器实际上预测所有的样本都为1。

经过以上的分析可得到：ROC曲线越接近左上角，该分类器的性能越好。

相比于其他的P-R曲线（精确度和召回率），ROC曲线有一个巨大的优势就是，当正负样本的分布发生变化时，其形状能够基本保持不变，而P-R曲线的形状一般会发生剧烈的变化，因此该评估指标能降低不同测试集带来的干扰，更加客观的衡量模型本身的性能。

AUC（Area under roc Curve）

ROC曲线面积，0.5-1之间。

博客等级

码龄7年

11
原创

7
点赞

14
收藏

4
粉丝

关注

私信

热门文章

分类专栏

机器学习 3篇
SQL 1篇
软件开发 2篇
算法面试 1篇
VsCode 1篇
网格剖分 1篇

展开全部收起

最新评论

常用激活函数简介
CSDN-Ada助手: 恭喜您写了第9篇博客！标题中的“常用激活函数简介”非常吸引人。您对激活函数进行了简明扼要的介绍，让读者能够快速了解它们的作用和特点。接下来，我建议您可以深入探讨每种激活函数的数学原理，并结合实际案例进行说明。这样可以让读者更好地理解它们在神经网络中的应用。再次恭喜您的持续创作，期待您的下一篇博客！
VsCode 修改中文显示
太过。: 你好，请问打不开loclae.json文件怎么办呀？
FreeFEM++根据给定网格尺寸剖分网格
qq_43482010: 大佬可以麻烦您帮调一下，freefem＋＋的代码吗，这东西太冷门了，已经无处可求救
VsCode 修改中文显示
tao1617: 谢谢，已解决~

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。