1.概念普及:
对于常见二分类问题,样本有两种分类结果(正例与反例)。
在进行分类时,对于一个样本,可能出现的分类情况有四种:
(正/正):真正类
(反/正):假反类
(正/反):假正类
(反/反):真反类
2.评价指标:
1.准确率accuracy: 被正确分类的样本数/样本总数
解读:总共有100个样本,其中有90个样本是预测正确的,则准确率为90%
缺点:不能反映模型区分正反例的能力
2.精确率precision: 被正确分类的正例样本数/总的正例样本数
解读:一共有100个样本,有50个正例和50个反例,有90个样本是预测正确的,其中被分类正确的正例样本数为50,被分类正确的反例样本数为40,则精确率为100%。
即该模型在预测正例方面的准确率是100%,
3.召回率recall: 被正确分类的正例样本数/所有被正确分类的样本数
解读:一共有100个样本,有50个正例和50个反例,有90个样本是预测正确的,其中被分类正确的正例样本数为50,被分类正确的反例样本数为40,则召回率为50/90%。
即该模型可以正确识别出所有正例的概率为0.555%
3.关系
决策树分类效果评价指标详解
最新推荐文章于 2023-07-04 02:55:08 发布