马修斯相关系数(简称:MCC; 全称:Matthews correlation coefficient)更适合类别不平衡问题的模型结果评价

一、举个例子

一般常见指标是F1-score、precision、recall、roc、auc、accuracy,但他们存在的最大问题是,没有考虑TN。
例如下面这个分类器,预测出21只是狗(其中18个TP,3个是FP),3只是猫(其中2个是FN、1个是TN):
在这里插入图片描述
计算得到对应的精确率和召回率看起来貌似还不错的样子:

Precision = TP/(TP+FP) = 18/(18+3) = 0.86
Recall = TP/(TP+FN) = 18/(18+2) = 0.90
F1 = 2 * (Precision*Recall/Precision+Recall) = 0.88

但实际上,如果使用马修斯相关系数来计算,其性能就差强人意了:
在这里插入图片描述
在这里插入图片描述

需要注意的是,在上面的计算公式中,分母中任意一对括号相加之和如果为0,那么整个MCC的值就为0。

在python中,scikit-learn模块包含MCC计算的函数

 from sklearn.metrics import matthews_corrcoef
 y_true = [+1, +1, +1, -1]
 y_pred = [+1, -1, +1, +1]
 matthews_corrcoef(y_true, y_pred)

在这里插入图片描述Where:
s = number of samples
c = number of samples correctly predicted
p = number of times class k was predicted
t = number of times class k really/truly occurred
K = number of classes

二、参考文档

  • https://cloud.tencent.com/developer/article/1975817
  • https://qinqianshan.com/machine_learning/sklearn/clustering-performance-evaluation/
  • https://www.cnblogs.com/qiu-hua/p/14905473.html
  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值