在学习分类问题的性能度量中,提出了查准率P和查全率R两个概念,可以根据模型结果测算出P值和R值绘制PR曲线,那么PR曲线是怎么绘制出来的呢?
首先我们要理解分类结果混淆矩阵如下:
其中T=True表示真,F=False表示假,P=Positive表示正例,N=Negative表示反例。这样就可以定义查准率P=TP/TP+FP(准确性)和查全率R=TP/TP+FN(完整性)了。查全率和查准率也是此消彼长的。也即是说查全率越高,查准率越低。我们假设真实的正例数量为GP(Ground-truth Positive),真实的反例为GN(Ground-truth Negative),模型推断正例数量为SP(Suspicious-Positive),模型推断的反例数量为SN(Suspicious-Negative)那么我们可以由以下表达式:
G P + G N = S P + S N GP+GN = SP + SN GP+GN=SP+SN
G P = T P + F N
对PR图的理解
最新推荐文章于 2023-10-23 22:53:57 发布