文章目录
一、四个基本概念 TP、FP、TN、FN
真阳性:预测为正,实际为正。把正样本成功预测为正。 TP
——True Positive
假阳性:预测为正,实际为负。把负样本错误预测为正。 FP
——False Positive ——>误报
真阴性:预测为负、实际为负。把负样本成功预测为负。 TN
——True Negative
假阴性:预测与负、实际为正。把正样本错误预测为负。 FN
——False Negative ——>漏报
注:一致判真假,预测判阴阳
1、真阳性:指预测正确,是哪个类就被分到哪个类。对A而言,TP个数为 2;对B而言,TP个数为 2;对C而言,TP个数为 1。
2、假阳性:就是指预测为某个类,但是实际上不是。对A而言,FP个数为 0;对B而言,FP个数为 2;对C而言,FP个数为 2。(因为"3"和"8"都不是B类,但却分给了B,所以为假阳性)
3、假阴性:对A而言,FN个数为 2;对B而言,FN个数为 1;对C而言,FN个数为 1。(因为"3"和"4"分别预测为B和C,但是实际是A,也就是预测为负,实际为正)
二、精确率(precision)、召回率(recall)、准确率(accuracy)
1、精确率
(查准率):计算预测出来的某类样本中,有多少是被正确预测的。即表示的是预测为正的样本中有多少是真正的正样本。针对预测样本而言。
2、召回率
(查全率):有多少样本被正确的预测出来了,即该类样本有多少被找出来(召回了多少)。即表示的是样本中的正例有多少被预测正确了。针对原先实际样本而言。
3、准确率
:正类和负类预测准确的比例。在正例较少负例较多的不平衡分类问题(疾病;恐怖分子)中,存在着如果把所有数据全部预测为负例,准确率依然会很高的问题,所以引入召回率。
根据多分类结果,可以根据样本的预测结果是否正确来形成混淆矩阵。
(1)加权准确率(Weighted Accuracy,WA)
(2)非加权准确率(Unweighted Accuracy,UA)
精确率