这四个值所代表的意义应该是做模式分类需要知道的基本知识了。以前是用的时候用一次查一次,但好像每次理解都不是特别到位。现在觉得真正理解了很有必要,就认真记录一下,帮助理解。
我们先从最简单的二分类说起:
假设我们现在有两类,一个正类,一个负类。对于每一个样本,有两个标签。一个是真正所属类别的标签,另一个是我们通过训练测试所赋予它的标签。后者是否与前者一致就成为了我们评价分类器表现好坏的一个标准。
这下就好办了:
TP(true positive):分类正确,把原本属于正类的样本分成正类。
TN(true negative):分类正确,把原本属于负类的样本分成负类。
FP(false positive):分类错误,把原本属于负类的错分成了正类。
FN(false negative):分类错误,把原本属于正类的错分成了负类。
由此延伸出来两种常用的比率:
TPR(true positive rate):
正类中分对的比例,也就是本属于正类,且被正确分类成正类占正类样本数的比例,计算公式为:
tp/(tp+fn)
FPR(false positive rate):
本属于负类但被错分占负类样本数的比例,计算公式为:
fp/(tn+fp)
常用的评价方式可参考http://m.blog.csdn.net/blog/liyuefeilong/44604001