二分类问题混淆矩阵和相关参数

最新推荐文章于 2024-07-26 08:38:49 发布

王先生的副业

最新推荐文章于 2024-07-26 08:38:49 发布

阅读量2.2k

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/uncle_gy/article/details/80379960

版权

机器学习专栏收录该内容

46 篇文章 3 订阅

订阅专栏

混淆矩阵

		预测的类
		+	-
实际的类	+	$f_{++}(TP)$	$f_{+-}(FN)$
	-	$f_{-+}(FP)$	$f_{--}(TN)$

TPFN

真正 $(true\space positive \space,TP)$ 或者 $f_{++}$ ,对应于被分类模型正确预测的正样本数。
假负 $(false\space negative\space,FN)$ 或者 $f_{+-}$ ,对应于被分类模型错误预测为负类的正样本数
假正 $f(alse\space positive\space,FP)$ 或者 $f_{-+}$ ，对应于被分类模型错误预测为正类的负样本数
真负 $(ture\space negative\space,TN)$ 或者 $f_{--}$ ,对应于被分类模型正确预测的负样本数

其他术语

真正率（true positive rate,TPR）

或者称灵敏度（sensitivity）
定义为被模型正确预测的正样本的比例，即：

T P R = T P T P + F N

$TPR=\dfrac{TP}{TP+FN}$

真负率（ture negative rate,TNR）

或者称特指率（specificity）
定义为被模型正确预测的负样本的比例，即：

T N R = T N T N + F P

$TNR=\dfrac{TN}{TN+FP}$

假正率（false positive rate,FPR）

定义为被预测为正类的负样本比例，即：

F P R = F P T N + F P

$FPR=\dfrac{FP}{TN+FP}$

假负率（false negative rate,FNR）

定义为被预测为负类的正样本的比例，即：

F N R = F N T P + F N

$FNR=\dfrac{FN}{TP+FN}$

召回率（recall）

度量被分类器正确预测的正样本的比例，即：

r e c a l l = T P T P + F N

$recall=\dfrac{TP}{TP+FN}$

精度（precision）

精度确定分类器断言为正类的部分实际为正类记录所占的比例，即：

p r e c i s i o n = T P T P + F P

$precision=\dfrac{TP}{TP+FP}$

$F_1$ 度量

精度和召回率可以合并为一个度量，称为 $F_1$ 度量
原则上 $F_1$ 为召回率和精度的调和均值

F 1 = 2 1 r + 1 p

$F_1=\dfrac{2}{\dfrac{1}{r}+\dfrac{1}{p}}$
一个高的

F1 F 1 $F_1$ 度量值确保精度和召回率都比较高。