查准率和查全率_浅谈查全率(Recall)和查准率(Precision)及准确率(Accuracy)及TPR....

最新推荐文章于 2024-06-07 21:26:16 发布

weixin_39819393

最新推荐文章于 2024-06-07 21:26:16 发布

阅读量1.8k

点赞数 1

文章标签：查准率和查全率

最近在学习ES的时候，偶然听到了两个词汇，分别是查全率和查准率，对应的场景是在ES检索时的IK分词器力度上；

简单了解了一下，发现是一个比较有意思的概念，遂记录于此，加深印象；

为了方便理解，我们通过一个混淆矩阵来描述这种关系，其矩阵如下：

通过上述矩阵，我们可以通过一些维度，获取到我们想要的指标，比如

TPR：意为正样本中预测为正的样本比例，其公式为：

FNR：意为正样本中预测为负的样本比例，其公式为：

FPR：意为负样本中预测为正的样本比例，其公式为：

TNR：意为负样本中预测为负的样本比例，其公式为：

同样，通过混淆矩阵，我们还可以算出本次预测的准确率(Accuracy)，及当前预测结果中，预测命中率，又称为精确度；精确度是分类正确的样本数占样本总数的比例。

关于查全率和查准率，在ES检索中使用IK分词器时，IK分词器有两种不同的分词力度，分别是粗粒度(ik_smart)和细粒度(ik_max_word)；这两种分词器刚好可以照应我们这里需要了解的查全率和查准率；

使用粗粒度分词，会产生的结果就是，查询的数据比较准确，但是不齐全；使用细粒度分词器，会产生的结果就是，查询的数据比较全面，但是不是很准确；

我们看一下查全率和查准率的概念；

查全率：查询的样本中为正的占查询出的数据的总量，也可以理解为真实为正样本中有多少是预测正确的；其公式如下：

查准率：真实为正的样本中占预测为正的样本的比例：其公式如下图

查准率和查全率是一对矛盾的度量。一般来说，查准率高时，查全率往往偏低；而查全率高时，查准率往往偏低。其模型如下图

weixin_39819393

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
查准率和查全率_浅谈查全率(Recall)和查准率(Precision)及准确率(Accuracy)及TPR....

最近在学习ES的时候，偶然听到了两个词汇，分别是查全率和查准率，对应的场景是在ES检索时的IK分词器力度上；简单了解了一下，发现是一个比较有意思的概念，遂记录于此，加深印象；为了方便理解，我们通过一个混淆矩阵来描述这种关系，其矩阵如下：通过上述矩阵，我们可以通过一些维度，获取到我们想要的指标，比如TPR：意为正样本中预测为正的样本比例，其公式为：FNR：意为正样本中预测为负的样本比例，其公式...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。