机器学习之混淆矩阵

Jd5i3n.png

在得到模型后,你需要借助一些指标来评估这个模型的好坏。人在学习后,会通过考试来评价学习效果,最终会评出优等生、差等生。机器学习也是一样的。区别只是机器学习会根据问题的不同,用不同的指标来进行模型效果的评估。对于分类问题,混淆矩阵是一种直观的模型效果分析方法。假设有个二分类模型,可以对一件事的正(P)负(N)作出判断。这样,在一次判断中,存在真实结果 y ^ \hat{y} y^ 和预则结果y。如果二者相等,也就是本次预测结果正确;反之则错误。假设有100个不同的测试用例,就会有以下四种可能性:

  1. 本来是P的用例被预测为P;
  2. 本来为P的用例被预测为N;
  3. 本来是N的用例被预测为P;
  4. 本来为N的用例被预测为N。

我们把这四种情况进行统计,就得到了这样的一个表格,这就是混滴矩阵。

在这个表中,横向表示预测结果,纵向表示真实结果。我们用TP、FP、FN、TN表示上面的四种可能性。这里面的T和F表示正确预测(true)或错误预测(false);而P和N是被T或F修饰的正负,显然这是预测值,因为只有预测值才有对错之分。那么,首先,TP为True Positive,含义为真的正样本。也就是预测值为P,真实值也是P的情况。这个例子中,共有20个样本属于TP。其次,FP为False Positive,含义为假的正样本,也就是预测值为P真实值为N的情况。这里共有8个样本属于FP。接下来,FN为False Negative,含义为假的负样本,也就是预测值为N真实值为P的情况。这里共有6个样本属于FN。最后的TN为True Negative,含义为真的负样本,也就是预测值和真实值都为N的情况。这里共有66个样本属于TN。有了混滴矩阵后,就能计算一些模型的统计量指标了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

落难Coder

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值