真正例、假正例、真负例、假负例、精确度、召回率快速理解

什么是“正例”?比如说,医学中癌症的良、恶性分类,“正例”是指“良性”还是“恶性”?看你自己的目标是什么,你想找恶性的就定义恶性为正例,反之就定义良性为正例,全看自己的定义。

其中精度又称为查准率:预测为正例的预测集内,正例预测正确的比率             例,在所有我们预测有恶性肿瘤的病人中,实际上有恶性肿瘤的病人的百分比,越高越好。

       召回率,又可称为查全率:整个正类样本中,预测正确的样本所占的比率     例,在所有实际上有恶性肿瘤的病人中,成功预测有恶性肿瘤的病人的百分比,越高越好。

      

       Precision是测量预测为阳性样本的样本中有多少是真实的阳性样本(True positive),而recall测量在所有阳性样本中有多少真实阳性样本被正确检测到。

精度通常与另一个指标一起使用,这个指标就是召回率(recall),也称为灵敏度(sensitivity)或者真正类率(TPR):它是分类器正确检测到的正类实例的比率.

     你不能同时增加精度并减少召回率,反之亦然。这称为精度/召回率权衡。

       因此我们可以很方便地将精度和召回率组合成一个单一的指标,称为F1 分数。当你需要一个简单的方法来比较两种分类器时。F1 分数是精度和召回率的谐波平均值。谐波平均值会给予较低的值更高的权重。因此,只有当召回率和精度都很高时,分类器才能得到较高的F1 分数。

          

单一的用recall或者precision来评价分类器也是不合理的,譬如文章开头说到的那个简单的classifier

我们通过公式可以惊奇的发现在两个样本集上的recall都是100%,这是因为所有的iphone6样本,分类器都可以把它预测对,但是准确率就大不相同了;在第一个数据集上的准确率precision为0.6,但是第二个样本集上的准确率只有可怜的0.05;对于第二个样本集的结果,我可以说classifier很好,因为recall很高,也可以说classifier不好,因为precision很低。不过很明显,这些说法都是不合理的;综合考虑两种指标才是直观的比较可靠的指标

微平均Micro-average=(TP + FP) / (TP + TN + FP + FN),分母就是输入分类器的预测样本个数,分子就是预测正确的样本个数(无论类别)

宏平均比微平均更合理,但也不是说微平均一无是处,具体使用哪种评测机制,还是要取决于数据集中样本分布

  • 11
    点赞
  • 56
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值