统计机器学习【1】- 入门机器学习（三）- 精确率P与召回率R

最新推荐文章于 2024-09-27 21:24:26 发布

David Wolfowitz

最新推荐文章于 2024-09-27 21:24:26 发布

阅读量429

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43763859/article/details/106301185

版权

机器学习专栏收录该内容

26 篇文章 1 订阅

订阅专栏

首先还是讲讲TP，FN，FP，TN先：
$T P — — 将正类预测为正类数；$

$F N — — 将正类预测为负类数；$

$F P — — 将负类预测为正类数；$

$T N — — 将负类预测为负类数；$
对于上面的我们可以这样理解，第一个字符表示该结果是预测错误的，第二个字符表示预测成了是正类（positive）还是负类（negative）。

精确率P：
$\frac{TP}{TP + FP}\tag{1}$
召回率R：
$\frac{TP}{TP + FN}\tag{2}$
F-measure：
$F_1 = 2 · \frac{precision · recall}{precision + recall}\tag{3}$

$F_\beta = (1 + \beta^2) · \frac{precision · recall}{\beta^2 · precision + recall}$

接下来举几个例子来理解:

一、图形表示理解

在这里插入图片描述
区域1指左边的长方形，区域2指右边的长方形，区域3指左边的半圆，区域4指右边的半圆。
区域1和区域2是给定的样本，其中区域1是正样本（真的），区域2是负样本（真的），区域3是前面讲的TP，区域4是FP。
其中，精确率P表示的是：
在这里插入图片描述

召回率R表示的是：
在这里插入图片描述

二、信息上下文检索

这是一个对于给定的搜索项返回相关文件的目录的任务，假定每个文件都分为两类：相关或不相关。在这个case中，相关文件属于相关类别，
召回率R被定义为被搜索出来中的相关文件文件的数目除以全部相关文件的数目，
精确率P被定义为被搜索出来中的相关文件数目除以被搜索出来的文件数目。

三、分类任务

在分类任务中，
一个类别A的精确率P（我们所关注的那个类别）被定义为被分类器分类为class A(这就是TP + FP)中实际上真正的label是A(TP)的数目除以分类器分类为class A的数目。

一个类别A的召回率R被定义为被分类器分类为class A(这就是TP + FP)中实际上真正的label是A(TP)的数目除以全部集合中真正属于类别A的数目(TP + FN)

注意，P和R是一对不可调和的矛盾，一个属性(P/R)的上升必然以另一个属性的下降作为代价。可以参考维基百科中脑瘤外科手术的例子 $^{【1】}$ 。

参考文献：
【1】Precision and recall
【2】统计学习方法-李航

David Wolfowitz

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。