一组样本,个数为M,正例有P个,负例有N个,
判断为正例的正例有TP个,判断为负例的正例有FN个(假的负例)P=TP+FN
判断为负例的负例为TN个,判断为正例的负例有FP个(假的正例)N=TN+FP
精确度(Precision)P=所有判断为正例的例子中,真正为正例的所占的比例=TP/(TP+FP)
准确率(Accuracy)A=判断正确的例子的比例=(TP+TN)/(P+N)
召回率(Recall)R=所有正例中,被判断为正例的比例=TP/P
漏警概率=1-R,正例判断错误的概率,漏掉的正例所占比率
虚警概率=1-P,错误判断为正例的概率,虚假正例所占的比率
假设原始样本中有两类,其中:
1:总共有 P个类别为1的样本,假设类别1为正例。
2:总共有N个类别为0 的样本,假设类别0为负例。
经过分类后:
3:有 TP个类别为1 的样本被系统正确判定为类别1,FN 个类别为1的样本被系统误判定为类别 0,显然有P=TP+FN;
4:有 FP 个类别为0 的样本被系统误判断定为类别1,TN 个类别为0 的样本被系统正确判为类别0,显然有N=FP+TN;
那么:
精确度(Precision):
P = TP/(TP+FP) ;
准确率(Accuracy)
A = (TP + TN)/(P+N) = (TP + TN)/(TP + FN + FP +TN);
召回率(Recall),也称为 True Positive Rate:
R = TP/(TP+FN) = 1 - FN/T;
转移性(Specificity,不知道这个翻译对不对,这个指标用的也不多),也称为 TrueNegativeRate
S = TN/(TN + FP) = 1 – FP/N;
F-measure or balanced F-score
F = 2 *
上面这些介绍可以参考:
http://en.wikipedia.org/wiki/Precision_and_recall
同时,也可以看看:http://en.wikipedia.org/wiki/Accuracy_and_precision
为什么会有这么多指标呢?
因此在统计信号分析中,有另外两个指标来衡量分类器错误判断的后果:
漏警概率(MissingAlarm)
MA = FN/(TP + FN) = 1 – TP/T = 1 - R;
虚警概率(False Alarm)
FA = FP / (TP + FP) = 1 –P;反映被判为正例样本中,有多少个是负例。