【机器学习百问】2.精确率与召回率的权衡问题

难度系数(5分制): 1
精确率与召回率的存在意义: 为解决分类问题中由于数据倾斜造成单一准确率失效问题。
介绍精确率与召回率之前引入一个判定表:
在这里插入图片描述
精确率定义Precision: Precision = TP/(TP+FP) 分类正确的正样本个数占分类器判定为正样本的比例,通常也称为查准率;
召回率定义Recall: Recall = TP/(TP+FN) 分类正确的正样本个数占真正正样本的比例,通常也称为查全率;

通俗意义上来说精确率代表了“很有把握”时正样本判定的比例,比如在癌症判定时将分类器的阈值上调为0.9,意味着当一个人有百分之90的概率为癌症患者时才判定他为癌症患者。
相反的召回率代表了“没有把握”时正样本的判定比例,比如将阈值下调为0.1,意味着当一个人有百分之10以下的概率为癌症患者时才判定他为健康人。
显然这两个标准都不能对模型的性能进以全面的评价,故需要对其进行权衡融合,使其能够相辅相成的全面评价一个模型的优劣。

最佳权衡方法: 使用精确率和召回率的调和平均值(F1 score)F1 = 2PR/(P+R);

已标记关键词 清除标记
©️2020 CSDN 皮肤主题: 技术黑板 设计师:CSDN官方博客 返回首页