det曲线_11566 P-R、ROC、DET 曲线及 AP、AUC 指标全解析(下)

本文深入探讨了Average Precision (AP)和Area Under the Curve (AUC)两种评估二分类器性能的指标。AP近似于P-R曲线下的面积,而AUC则是ROC曲线下的面积。两者都不能直接作为目标函数进行优化,但提供了衡量分类器性能的数值。文章还介绍了如何使用矩阵运算高效计算这两个指标,并提供了Matlab代码示例。
摘要由CSDN通过智能技术生成

.  上篇讲解了 P-R、ROC、DET 三种曲线,本篇来讲解 AP、AUC 两种指标。指标的作用,就是用一个数字衡量二分类器的好坏,便于对不同的二分类器进行比较。本篇会讲解 AP、AUC 两种指标的定义,它们与各种曲线的关系,以及如何准确、高效、简洁地编程计算两种指标。

五、Average Precision(AP)指标

AP 指标的定义是这样的:把阈值设置在紧靠每个正例之下,计算正类的查准率

,再取平均值。沿用上篇开头的例子:图 5.1:计算 AP 指标的一个例子

把阈值设置在紧靠第 1、2、3、4 个正例之后,正类的查准率分别是 1、1、0.6、0.5,所以 AP 指标等于

如果有多个正例的得分相同,那么阈值设置在紧靠它们之下时的查准率,在取平均时也会被计算多次。比如,如果图 5.1 中得分为 0.6 的两个样例都是正例,那么 AP 就会变成

有些任务可以分解成多个二分类子任务。比如我的博士课题「声音事件检测」,每条录音里可能有多种声音事件,所以可以看成是对每一种事件进行二分类。要用一个数字来衡量这种系统的性能,可以对每一种事件计算 AP,然后再取平均值,结果称为 mean average precision(MAP)。这里的 mean 和 average 的对象不同:average 是对阈值设在各个位置时的查准率求平均,而 mean 是对各个子任务求平均。

AP 指标跟 P-R 曲线有着微妙的关系。对于图 5.1 中的例子,我们标出阈值设置在紧靠每个正例之后时,P-R 曲线上对应的点。可以发现,AP 指标等于图中浅蓝色部分的面积。这个面积跟 P-R 曲线下的面积非常接近,只是差了几个小三角形。当数据量大了的时候,这些小三角形的面积就可以忽略不计了,所以可以说,AP 约等于 P-R 曲线下的面积。图 5.2:AP 等于浅蓝色部分的面积,约等于 P-R 曲线下的面积

AP 还可以不严格地写成积分的形式:

。这个积分式能够体现 AP 的定义:阈值下移时,每越过一个正例,就让正类的查全率增加一点儿(

);这些时候的正类查准率

的平均值就是 AP。当然,也可以反过来把积分式写成

,不过这就更不严格了,因为 P-R 曲线并不一定是单调递减的,同一个

可能对应着多个

。另外,P-R 曲线的最右端

并没有下降至 0,而是只下降到正例所占比例

。在积分式中,

小于

时,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值