深度学习基础篇：分类器性能评估

最新推荐文章于 2021-09-18 11:36:59 发布

Bonjour~Bridge

最新推荐文章于 2021-09-18 11:36:59 发布

阅读量770

点赞数

分类专栏：计算机视觉基础人脸识别实战(深度学习) 文章标签：深度学习人工智能机器学习

本文链接：https://blog.csdn.net/yuanyuneixin1/article/details/105543743

版权

人脸识别实战(深度学习) 同时被 2 个专栏收录

11 篇文章 23 订阅

订阅专栏

计算机视觉基础

8 篇文章 4 订阅

订阅专栏

当我们遇到数据极度偏移的特殊情况时，我们就不能用常用的百分比来评估分类器的好坏了，比如当我们查1万人中是否患有癌症的时候，癌症的患病率为一万分之1，而你的模型能够达到99.9%的准确率，其实你的模型并不好，因为我直接猜测每个人都是健康的，准确都是99.99%，比你的模型准确更高，所以，此时我们需要更好的验证模型好坏的方法，就是查全率和查准率、F₁值、ROC曲线

我们先来理解“混淆矩阵”

预测 / 实际	正类（positive）	负类（negative）
正类（True）	TP	FN
负类（False）	FP	TN

假设100人中，有3个人患病，则P = 97，N = 3，但是模型预测有2个人患病：则ture=98，false=2，但是预测患病中只有1人真正患病，则：

健康人中，预测为健康的人： $\frac{96}{97}$
健康人中，预测为患病的人： $\frac{1}{97}$
患病中，预测健康的人： $\frac{2}{3}$
患病中，预测患病的人： $\frac{1}{3}$

查准率（精准率 precision）

在“真实”的正类中，预测正确的概率 $\frac{TP}{TP + FP}$

使用环境：宁愿少找几个患病的人，一定要判断清楚患病的人是否真实患病，非常严格、谨慎的判断，患病的不能错判，比如用在癌症患者身上

查全率（召回率 recall）

在"预测"的正类中，预测正确的概率 $\frac{TP}{TP + FN}$

使用环境：宁愿多找几个患病的人，也一定要找到这3个患病的人，宁错判，不放过患病的患者，比如用在传染性病患者身上

那我们能不能在查准率和查全率之间平衡呢？可以用下面：F₁值

F₁值

F₁值是查全率与查准率的调和均值。当查全率和查准率都很高的时候，F₁也很高，其定义如下：

$\frac{2}{F_{1}} = \frac{1}{P} + \frac{1}{R}$

$F_{1} = \frac{2TP}{2TP + FP + FN}$

所以，如果我们希望差准率和查全率都比较高，可以让F₁值比较高，另外还有一种ROC曲线

ROC 曲线（即受试者工作特征曲线receiver operating characterristice curve）

总结的话：曲线越靠近左上角越好

先看图，下面是一张ROC曲线图：
上图黑色的曲线最好

横坐标为假阳性概率，我们希望它越小越好
纵坐标为真阳性概率（查全率），我们希望越大越好
所以，上图黑色的曲线最好

Bonjour~Bridge

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习基础篇：分类器性能评估

当我们遇到数据极度偏移的特殊情况时，我们就不能用常用的百分比来评估分类器的好坏了，比如当我们查1万人中是否患有癌症的时候，癌症的患病率为一万分之1，而你的模型能够达到99.9%的准确率，其实你的模型并不好，因为我直接猜测每个人都是健康的，准确都是99.99%，比你的模型准确更高，所以，此时我们需要更好的验证模型好坏的方法，就是查全率和查准率、F1值、ROC曲线我们先来理解“混淆矩阵”预...
复制链接

扫一扫