深入理解查准率与查全率

最新推荐文章于 2024-01-22 19:19:23 发布

阿童木-atom

最新推荐文章于 2024-01-22 19:19:23 发布

阅读量2.1w

点赞数

分类专栏：算法大数据机器学习算法文章标签：机器学习查准率查全率召回率

本文链接：https://blog.csdn.net/zhaojianting/article/details/79651492

版权

24 篇文章 3 订阅

订阅专栏

22 篇文章 0 订阅

订阅专栏

11 篇文章 0 订阅

订阅专栏

欢迎关注鄙人公众号，技术干货随时看！

查准率与查全率（召回率）是在信息检索与机器学习领域常用的衡量指标，书籍或网络上有非常多的定义，敝人在重温周志华先生《机器学习》一书时，发现书中的定义是非常科学的，而且把这两个指标根据混淆矩阵进行了数学化！

在信息检索领域的定义：检索出的n个文档中正确结果（m个结果是正确的）的比率即是查准率，即p=n/m；假设在所有的数据中正确结果有n个，一次检索结果中正确的个数是m个，查全率即召回率定义为 r = m/n

在机器学习领域：假设在一次预测中，预测总数目是n个，其中m个是预测结果中正确的数据，g 是预测出和没预测出正确结果的总和，那么查准率p=n/m，查全率r = m/g

下面给出混淆矩阵

查准率P和查全率R分别定义为

P = TP/(TP+FP)

R = TP/(TP+FN)

由以上可以看出，一般情况下查准率和查全率是此消彼长的一对量。当提高查准率时，可以只返回预测概率靠前的几个结果，但此时可能会漏掉一部分正确的结果，导致查全率降低，反之依然！具体应用中应该在查准率与查全率间寻找一个可以接受的平衡值

关注

专栏目录