「机器学习」准确率、精确率、召回率、F1分数、ROC-AUC
机器学习
最后更新 2020-08-31 16:22
阅读 210
最后更新 2020-08-31 16:22
阅读 210
机器学习
在机器学习中衡量一个模型是否准确我们有很多指标:
准确率 - accuracy
精确率 - precision
召回率 - recall
F1分数-F1 score
ROC曲线下面积 - ROC-AUC (area under curve)
那么,这些指标到底都是什么呢?各自有什么优缺点呢?笔者在了解这些指标的时候是在网上各大网站(CSDN、博客园、知乎)上找文章学习的。但是这些文章要么是过于数学化,要么是有地方不那么好读(前后变量不一致导致阅读苦难)、要么是过于“去数学化”。我自己整理了一份学习笔记,一定能够让大家一次性读懂这几个指标。
下面进入正文:
大家要明白,以上指标统统离不开一个工具:混淆矩阵-confusion matrix
混淆矩阵是个什么东西?
对于二分类问题,每一条数据要么预测正确,表示为1;要么预测错误,表示为0(注意这里是预测结果正确与否,而不是预测结果是0还是1),而事物本身也是被分为0(负样本)和1(正样本)两类。
用矩阵来表示就是这个样子
![混淆矩阵](https://dataset.flyai.com/混淆矩阵.jpg)
TP:True&Positive(positive表示正样本,true表示预测正确,即预测为positive是正确的)