评价一个分类器的metric的确有不少。
error rate: 这个不讲了, 当然是错误率越低越好。
不过值得提到的就是可以通过一个被称为confusion matrix的办法直观展示classification error。 继而可以引出三个指标。
如下一个three class problem:
表示的意思是总共有8只猫, 6只狗, 13只兔子。 我们的分类器把这17只动物分成了7只猫(5个TP(true positive), 2个FP(false positive)), 8只狗(3个TP, 5个FP), 12个兔子(11个TP, 1个FP)。 所有分对了的样本都位于对角线处。 对于二类分类问题, 可以建立如下的confusion matrix: