1 ROC分析相关
ROC(Receiver Operating Characteristic,受试者工作特征曲线)的概念来自信号检测原理中
- 最初只是为了区分噪声和非噪声
- 对于二分类问题具有很好的表现性能(仅仅是二分类问题,即是非,无有,0/1等)
- 通过以(FPR,TPR)为坐标点画出二维平面中的曲线,即ROC曲线
Recall = TPR = TP/(TP+FN)
(True Positive Rate,也叫”sensitivity”或者”recall”或”召回率”或”查全率”或”真阳性率”)FPR = FP/(FP+TN)
(False Positive Rate,也叫”Fall-Out”或者”假阳性率”)
- 其他相关的性能评价标准
Precision = TP/(TP+FP)
(精确度/率)Accuracy = (TP+TN)/(P+N) = (TP+TN) / (TP + FN + FP + TN)
(准确率,姑且这么叫吧,其中P为所有的正样本,N为所有的负样本)F-Meature = 2(Precision*Recall)/(Precision + Recall)
上面有些概念还是不要看中文的好,直接用英文意思就好了,不然看到不同的文章会有不同的叫法,会误导自己。
这里着重理解ROC曲线求取最优阈值或者说最优分类器。下面通过一个例子来分析&