机器学习模型质量评价标准 — 精准率、召回率

1. 分类模型评判指标: Precision、Recall 和 F1Score

对于分类而言,最简单也是最常见的验证指标:

  • 精准率( Precision
  • 召回率( Recall),
  • 为了综合这两个指标并得出量化结果,又发明了 F1Score

对一个分类模型而言,给它一个输入,它就会输出一个标签,这个标签就是它预测的当前输入的类别。

假设数据 data1 被模型预测的类别是 Class_A 。那么,对于 data1 就有两种可能性: data1 本来就是 Class_A (预测正确), data1 本来不是 Class_A (预测错误)。

当一个测试集全部被预测完之后,相对于 Class_A ,会有一些实际是 Class_A 的数据被预测为其他类,也会有一些其实不是 Class_A 的,被预测成 Class_A ,这样的话就导致了下面这个结果:

预测结果.jpg

  • 精准率: Precision=TP/(TP+FP) ,即在所有被预测为 Class_A 的测试数据中,预测正确的比率。

  • 召回率: Recall=TP/(TP+FN) ,即在所有实际为 Class_A 的测试数据中,预测正确的比率。

  • F1Score = 2*(Precision * Recall)/(Precision + Recall)

显然上面三个值都是越大越好,但往往在实际当中 P 和 R 是矛盾的,很难保证双高。

此处需要注意, PRF1Score 在分类问题中都是对某一个类而言的。

也就是说假设这个模型总共可以分 10 个类,那么对于每一个类都有一套独立的 PRF1Score 的值。衡量模型整体质量,要综合看所有 10 套指标,而不是只看一套。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值