1.机器学习常见模型评价指标

 这里主要是讲述分类问题。多分类问题是能够转化为二分类问题的。因此评价指标主要都是基于二分类来提出的。

1.混淆矩阵

  • 优点:能够很好地包含了整体的分类结果信息
  • 缺点:不直观,外行看不懂

2.准确度(Accuracy)

所有样本中被分类正确的比例。缺点就是不能衡量分布不均匀的情况。

计算时,分子就是混淆矩阵中对角线上的元素。

3. 精度(precison)

精确度也叫查准率,模型预测为正例的样本中,有多少位真正的正例。就是看模型对于我们所关注类别(也就是正例)预测的准确性。

计算就是考虑混淆矩阵的左边一列。 

 4.召回率(Recall)

也叫查全率。就是关注所有的实际正例中,有多少被预测准确的(就是数据集中有多少实际正例,能够被模型给找出来)。

计算是看混淆矩阵的上面一行。

4.F1-score

F1 Score是对精度和召回率的调和平均。好处就是当precision和recall有一项接近于0时,f1的值都会接近于0。 当两者都比较高时,f1值就比较高。

一个好的模型就是要让TP和TN的占比更高(正对角线元素),FP和FN尽可能地少(负对角线)

F-\beta Score 和F2 Score

 \beta 的不同取值让模型更具有倾向性。 取0.5时就更倾向于precision,就是让预测出来的尽可能都是正确的; 取2时就更倾向于recall,就是希望模型能够吧所有的实例都找到(可以忽略预测成本);取1就是没有倾向性。

5.多分类评价指标

多分类其实和二分类一样,也可以画出对应的混淆矩阵。例如右图中,正确预测的就是对角线上的。然后圈起来红色的2就是只实际标签为5模型预测出来为4的样本数。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值