混淆矩阵是一种常见的评判分类好坏的方式。
所有正确的预测结果都在对角线上,所以从混淆矩阵中可以很方便直观的看出哪里有错误,因为他们呈现在对角线外面。
例如下表:
我们可以非常直观地看出对b类预测的非常准确,而对c类的预测却差强人意 。
允许我们做出更多的分析,仅考虑对a类的分类,可以得到下表:
可以得到精度(precision),召回率(recall),结合两者的F1数。
precision=tp/(tp+fp);
recall=tp/(tp+fn);
2/f1=1/precision+1/recall;
f1=2*precision*recall/(precision+recall).
sklearn包中有将混淆矩阵展示的脚本,链接如下:
http://scikit-learn.org/stable/auto_examples/model_selection/plot_confusion_matrix.html