分类任务中常用的性能度量
1.错误率与精度
错误率与精度是分类任务中常用的两者性能度量,既适用于二分类也适用与多分类。概念其实很容理解,错误率即错误分类的样本数(预测结果与真是标记不一致)占总样本数的比例:
错误率
精度反之,正确分类的样本数(注意:正例分类正确与反例分类正确的和)占总样本数比例。
精度
2.查准率、查全率与F1
错误率和精度虽常用,但并不能满足所以任务要求。比如有时候我们更关心“所有的正例中有多少正例被分类出来了”→查全率,或者“预测正确分类中真正例比例占多少”→查准率
对于二分类问题,我们可以就分类结果得到混淆矩阵如下:
查准率,又叫准确率,缩写表示用P。查准率是针对我们预测结果而言的,它表示的是预测为正的样例中有多少是真正的正样例。定义公式如3所示。