机器学习中对于分类模型常用混淆矩阵来进行效果评价,混淆矩阵中存在多个评价指标,这些评价指标可以从不同角度来评价分类结果的优劣,以下内容通过简单的理论概述和案例展示来详细解释分类模型中混淆矩阵的评价指标及其用途。
1、混淆矩阵的概念
2、衍生评价指标
3、ROC曲线、AUC指标
4、R&Python中混淆矩阵函数
1、混淆矩阵的基本概念
对于分类模型而言(这里仅以最简单的二分类为例,假设只有0和1两类),最终的判别结果无非就四种情况:
实际为0被正确预测为0,实际为0被错误预测为1,实际为1被错误误测为0,实际为1被正确预测为1。
以上四类判别结果展示在混淆矩阵上是一个两行两列的交叉矩阵,行分别代表实际的正例和负例,列分别代表预测的正例和负例。
那么在以上矩阵中:四个象限分别代表四种判别结果:
左上角被称为真阳性(True Positive,TP):样本实际为正(这里的正负仅仅是相对意义上我们想要研究的类别)例,且模型预测结果为正例;
右上角被称为假阴性(False Negative,FN):样本实际为正例,但模型预测为负例;
左下角被称为假阳性(False Positive,FP):样本实际类别为负例,但模型预测为正例;
右下角被称为真阴性(True Negative,TN):样本实际类别为负例,且模型预测为负例。