NLP Evaluation Metric 分类问题

最新推荐文章于 2024-04-05 16:49:11 发布

毛球饲养员

最新推荐文章于 2024-04-05 16:49:11 发布

阅读量1.4k

点赞数

分类专栏： nlp 文章标签：自然语言处理评价指标宏平均微平均 Evaluation Metric

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012442157/article/details/80309088

版权

nlp 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

一、Background

在学会了用deeplearning做情感分类之后，如何评价自己的模型有效果呢？如果没有评价指标的话，别人也没法知道你的方法好不好，那么你所做的一切都是浮云。

最简单的评价指标就是准确率（Accuracy），常用的还有精确率（Precision）、召回率（Recall）、F值、宏平均与微平均等等。并且现在的分类基本上都是多分类问题，我就直接按照多分类来阐述。

二、评价指标

多类分类问题中，分类结果一般有4种情况:

属于类C的样本被正确分类到类C，记这一类样本数为TP
不属于类C的样本被错误分类到类C，记这一类样本数为FP
属于类别C的样本被错误分类到类C的其他类，记这一类样本数为FN
不属于类别C的样本被正确分类到了类别C的其他类，记这一类样本数为TN

1、Accuracy
准确率

A c c u r a c y = T P + T N T P + F P + F N + T N

$Accuracy = \frac{TP + TN}{TP + FP + FN + TN}$
2、Precision
精确率

P r e c i s i o n = T P T P + F P

$Precision = \frac{TP}{TP + FP}$
3、Recall
召回率

R e c a l l = T P T P + F N

$Recall = \frac{TP}{TP + FN}$
4、F-measure
F值

F = (1 + β 2) * P r e c i s i o n + R e c a l l ( β 2 * P r e c i s i o n ) + R e c a l l

$F = (1 + \beta^{2})*\frac{Precision + Recall}{(\beta^{2}*Precision) + Recall}$
通常情况下，

β β $\beta$ 取为1。

5、Macro-averaging
宏平均是指所有类别的每一个统计指标值的算数平均值，也就是宏精确率

P r e c i s i o n m a c r o = 1 N \sum i = 0 N P i

$Precision_{macro} = \frac{1}{N}\sum\limits_{i=0}^{N}P_{i}$

R e c a l l m a c r o = 1 N \sum i = 0 N R i

$Recall_{macro} = \frac{1}{N}\sum\limits_{i=0}^{N}R_{i}$

F m a c r o = 2 * P r e c i s i o n m a c r o * R e c a l l m a c r o P m a c r o + R m a c r o

$F_{macro} = \frac{2 * Precision_{macro} * Recall_{macro}}{P_{macro} + R_{macro}}$

这里写图片描述

这里写图片描述

三、Demo

四、Reference

不得不说这个有很多错误，但还是有值得借鉴的地方
https://sanmisanfan.github.io/2017/08/16/mulitlable-classification/

http://www.cnblogs.com/robert-dlut/p/5276927.html
https://zhuanlan.zhihu.com/p/30953081

毛球饲养员

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。