这四个概念之前一直混淆着我,今天好好地梳理一遍,通过一个简单的二分类问题给出各自的解释
先给出各自的定义:
错误率:指分类错误的样本数占样本总数的比例,对于样本集D,定位错误率为:
准确率accuracy:分类正确的样本数占样本总数的比例
精确率(查准率)precision:表示被分为正例的个数中实际为正例的比例
召回率(查全率):表示有多少个正例被准确分为了正例
我们用一个二分类的混淆矩阵来表示
真实情况 预测结果(正) 预测结果(反)
正 TP(真正例) FN(假反例)
反 FP(假正例) TN(真反例)
错误率:
准确率:
查准率:
召回率: