1、混淆矩阵
二分类任务中用准确率、精度和召回率三大指标评估模型性能,在介绍这些概念之前先介绍混淆矩阵的概念。二分类的混淆矩阵包含四个值:真正例(TP)、假正例(FP)、真反例(TN)、假反例(FN)。如果将一个数据点预测为正例,但它实际是反例,那么它就是一个假正例。
混淆矩阵 |
真实值 |
||
---|---|---|---|
Positive |
Negative |
||
预 测 值 |
Positive |
True Positive |
False Positive |
Negative |
False Negative |
True Negative |
2、评估指标
示例场景:100个人中有5个恐怖分子,我们要用一个模型识别出哪些是恐怖分子,此时恐怖分子即为正例,非恐怖分子是负例。
2.1 准确率(accuracy)
定义:在预测的结果中所有被正确预测的正类和正确预测的负类的和占总体样本数的比重