混淆矩阵的作用:
1)用于观察模型在各个类别上的表现,可以计算模型对应各个类别的准确率,召回率;
2)通过混淆矩阵可以观察到类别直接哪些不容易区分,比如A类别中有多少被分到了B类别,这样可以有针对性的设计特征等,使得类别更有区分性;
简单来说就是看看有多少错判的.
以上面图片为例:
上面是一个4分类的问题,类别分别为正常,色情,广告,违禁。以正常类别为例进行解释:
准确率:列相加,( 92516 + 467 + 5650 + 789 )= 99422, 其中 92516个样本被预测对了,因此准确率为:92516/99422= 0.930538513
召回率:行相加,模型一共召回了 (92516 + 53+ 1676 + 179 )=94424 个样本,模型认为一同有94424个样本是属性正常类别的,但是正确的只有92516个,因此召回率为:92516/94424= 0.979793273