混淆矩阵中准确率,精准率,召回率区别https://blog.csdn.net/abc_xian/article/details/106908517
刚才分析的是二分类问题,那么对于多分类问题,混淆矩阵表示的含义也基本相同,这里我们以三类问题为例,看看如何根据混淆矩阵计算各指标值。
多分类混淆矩阵
与二分类混淆矩阵一样,矩阵行数据相加是真实值类别数,列数据相加是分类后的类别数,那么相应的就有以下计算公式;
精确率_类别1=a/(a+d+g)召回率_类别1=a/(a+b+c)
假设下图红色为预测为正样本 蓝色为负样本,虚线下的是正样本,向上的是负样本,虚线设置在不同的高度即有不同的情况,如设置在最高1处,则预测全为正样本,设置不同的阀值对应不同的混淆矩阵,不同的混淆矩阵又可以进一步判断该模型下当前阀值的准确率,精准率,召回率。从而根据需要选择最适合的阀值。但由于0到1可以取无限的数值,因此阀值也是无限的,这样不利于我们判断哪个阀值才是最合适的,因此就有了ROC曲线