confusion matrix通常称为contingency table,我们现在讨论的case里有两个class。这个matrix可以非常大。正确分类的instances数是matrix的对角线上数字的和,其他的都是不正确分类的。斜对角线上的数字为假正和假负。
True positive(TP) rate,被正确分类为class x的比率。与recall相同。=正确分类为class x的数目/被分类为class x的总数目。在上图Confusion Matrix中为89/(89+2)。
False positive(FP) rate,被错误分类为class x的比率。=错误分类为class x的数目/被分类为class x的总数目。在上图Confusion Matrix中为2/(89+2)。
Precision,类型为class x的instances被正确分类为class x的比率。在matrix中,为89/(89+6)。
F-Measure,=2×Precision*Recall/(Precision+Recall))。precision和call的组合拳。
Ps:
cross: 每次取9/10训练,1/10测试。合起来是准确和召回效果。
training: 全部数据训练,全部数据测试。
方法不太一样。所以准确率会有些变化,cross结果更可靠
training: 全部数据训练,全部数据测试。
方法不太一样。所以准确率会有些变化,cross结果更可靠