马休斯相关系数是衡量二分类模型结果的评估指标之一,具体参考Matthews Correlation Coefficient is The Best Classification Metric You’ve Never Heard Of,它能解决不均衡类别数据的指标衡量问题,首先介绍precision、recall及F1-score指标存在的问题。
precision、recall及F1定义
混淆矩阵的定义如下:
positive(true) | negative(true) | |
---|---|---|
positive(predict) | TP | FP |
negative(predict) | FN | TN |
则precision、recall、F1、TPR、FPR的定义如下:
p r e c i s i o n = T P T P + F P precision = \frac{TP}{TP+FP} precision=TP+FPTP
r e c a l l = T P T P + F N recall = \frac{TP}{TP+FN} recall=TP+FN