搞机器学习的人一定频繁的听到ROC,AUC或者AUC-ROC,但这个概念又不向准确率召回率那么直观容易理解,给我带来了小小的困扰,这里就系统的学习下这两个概念。
ROC
ROC即Receiver Operating Characteristics, 中文一般翻译成“受试者工作特性曲线”。
这是一种度量二分类性能的指标。直观来讲,ROC曲线表示的是模型在准确识别正例
和不把负例错误的识别成正例
这两种能力之间相互制约的关系
(当我们需要“宁可错杀一千,也不放过一个”的时候,ROC能告诉你到底要错杀多少才能一个坏人都不放过)。
在详细解释ROC之前需要先解释两个前置概念,即TPR(True Positive Rate)和FPR(False Positive Rate)。
TPR 真正率(召回率):找出的正例占所有的正例的比率。比如有10人换糖尿病,通过模型确诊了其中的8个,则 TPR=0.8
FPR 假正率: 即所有的负例中分类错误的比例。比如有十个人没有