PR(Precision-Recall)曲线是一种用于评估二分类模型性能的工具,重点关注的是正例的精确性(Precision)和召回率(Recall)之间的权衡关系。与ROC曲线不同,PR曲线将真正例率(TPR)和假正例率(FPR)替换为精确性和召回率,因此更适合于不平衡类别分布的情况,其中正例的数量较少。
以下是PR曲线的关键概念和计算方法:
-
精确性(Precision):精确性表示模型正确预测为正例的样本数量与所有被模型预测为正例的样本数量之间的比例。计算方式为:
其中,TP表示真正例的数量,FP表示假正例的数量。
-
召回率(Recall):召回率也称为真正例率(True Positive Rate,TPR),表示模型成功预测为正例的样本数量与所有实际正例的样本数量之间的比例。计算方式为: