模型评价指标总结
对于一个模型来说,如何评价一个模型的好坏,如何衡量一个模型的泛化能力是机器学习中的一个关键性问题,对于二分类问题来说,单单只通过最后的预测准确率来说,
由于原始数据可能是分平衡的数据因此只凭准确率并不能说明你这个模型的效果优良。因此,对于机器学习的两大类问题:分类与回归,现将一些模型的评价指标进行总结
1.分类问题
1.1 混淆矩阵
混淆矩阵(confusion matrix)其实就是一张表格,之所以叫做混淆矩阵,是因为能够很容易的看到机器学习有没有将样本的类别给混淆了,以二分类的问题为例,其对应的混淆矩阵的表格如下
正例为positive 负例为negative 横轴为预测值 纵轴为 真实值
则在混淆矩阵的表格中各个部分所表达的意义为:
TP:True Positive 真正例 表示预测值与真实值都为正例的个数
TN:True Negative 真反例 表示预测值与真实值都为反例的个数
FP: False Positive 假正例 表示真实值为反例 但是把它预测成了正例
FN: False Negative 假反例 表示真实值是正例 但是把它预测成了反例
1.2 准确率
准确率 (Accuracy)也就是预测正确的数目比上总的个数,根据上表可得准确率的公式为