计算交叉矩阵以评估分类的准确度
所定义交叉矩阵
C为Cij在i组中观察的观测值数量在j组的值
在二进制分类中,正确的负值为C
0,0
,错误预测的负值为C
1,0
,错误的正值为C0,1
,正确的正值为C
1,1
看个例子API里面的:
>>> from sklearn.metrics import confusion_matrix
>>> y_true = [2, 0, 2, 2, 0, 1]
>>> y_pred = [0, 0, 2, 2, 0, 2]
>>> confusion_matrix(y_true, y_pred)
array([[2, 0, 0],
[0, 0, 1],
[1, 0, 2]])
第一行:真值为0,预测为0的有2个
真值为0,预测为1的有0个
真值为0,预测为2的有0个
剩余同理,基本上这个函数就是这个意思,对比预测值与实际值之间的差别