T:True--正确预测
F:False--错误预测
N: Negative--预测为负样本
P: Positive--预测为正样本
(PR曲线中的R)Recall = TP/(TP+FN)=TP / T(真阳率/召回率),所有正样本中有多大比例预测为正样本。
(PR曲线中的P)Precesion = TP/(TP+FP) =TP / P(精准率),所有预测为正样本中有多大比例为真正的正样本。
在ROC空间,ROC曲线越凸向左上方向效果越好。与ROC曲线左上凸不同的是,PR曲线是右上凸效果越好。
PR曲线:Recall为横坐标,Precision 为纵坐标。
PR曲线(ROC曲线)是如何画出来的?
当某一个模型对样本总体进行预测时,会得到每一个样本相应的概率值,将概率值从高到低排序,若将第一个预测为正样本,其余预测负样本,则可以得到相应的Recall与Precision;将前两个预测为正样本,其余预测负样本,则可以得到相应的Recall与Precision;将前三个预测为正样本,其余预测负样本,则可以得到相应的Recall与Precision,以此类推,可以在坐标轴上画得PR曲线(ROC曲线)。
PR曲线(ROC曲线)说明什么问题?
PR曲线(ROC曲线)的面积说明模型预测的区分度,当模型预测区分度较高,极端情况,预测正样本全对且概率值为1,预测负样本全队且概率值为0,这样直接就为正方形,模型效果最好,区分度最明显。稍差一点的,正负两类概率值差别较大,且正的概率趋近于1,负的概率趋近于0,会趋近正方形。
其他待更新。。。。