【自然语言处理】——分类的评价指标

一、四个基本概念

         TP、True Positive   真阳性:预测为正,实际也为正

         FP、False Positive  假阳性:预测为正,实际为负

         FN、False Negative 假阴性:预测与负、实际为正

         TN、True Negative 真阴性:预测为负、实际也为负。

        【一致判真假,预测判阴阳。】

在这里插入图片描述

二、F1-score 

      F1分数(F1-score)是分类问题的一个衡量指标。一些多分类问题的机器学习竞赛,常常将F1-score作为最终测评的方法。它是精确率和召回率的调和平均数,最大为1,最小为0。

F_{1}=2\cdot \frac{precision\cdot recall}{precision+recall}

      此外还有F2分数和F0.5分数。F1分数认为召回率和精确率同等重要,F2分数认为召回率的重要程度是精确率的2倍,而F0.5分数认为召回率的重要程度是精确率的一半。计算公式为:

F_{\beta }=\left (1+\beta ^{2} \right )\cdot \frac{precision\cdot recall}{\left (\beta ^{2}\cdot precision \right )+recall}

      G分数是另一种统一精确率和的召回率系统性能评估标准,G分数被定义为召回率和精确率的几何平均数。

G=\sqrt{precision\cdot recall}

三、查准率/查全率

        1、精准度 / 查准率(precision):指被分类器判定正例中的正样本的比重

precision_{k}=\frac{TP}{TP+FP}

         2、召回率 / 查全率 (recall):指的是被预测为正例的占总的正例的比重

recall_{k}=\frac{TP}{TP+FN}

         3、另外,介绍一下常用的准确率(accuracy)的概念,代表分类器对整个样本判断正确的比重。

accuracy=\frac{TP+TN}{TP+TN+FP+FN}

         4、通过对第三步求得的各个类别下的F1-score求均值,得到最后的评测结果,计算方式如下:

score=(\frac{1}{n}\sum f1_{k})^{2}

 三、其他

        参考链接:  ROC曲线与AUC值

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值