ROC曲线一般用于分类问题,衡量分类模型好坏的一个指标
首先对样本进行如下划分
| 预测真 | 预测假 |
实际真 | TP(True Positive) | FN(False Negative) |
实际假 | FP(False Positive) | TN(True Negative) |
概念一:真正类率 (true positive rate ,TPR) TPR = TP/(TP+FN)
概念二:负正类率(false positive rate, FPR)FPR=FP/(FP+TN)
ROC横坐标是FPR,纵坐标是TPR
延伸一:ROC与横坐标组成的面积为AUC,AUC越大说明模型性能越好
精确率定义为:
准确率描述的是预测为真的样本中实际为真的概率
召回率定义为:
召回率定义为实际为真的样本中预测为真的概率
若要求提高准确率,不在意召回率的时候,我们可以减少召回的数量,极端情况,只召回一个我们认为最为可能的物料,如果实际为真那么准确率就是100%