ROC曲线简介
受试者工作特征曲线 (receiver operating characteristic curve,简称ROC曲线),又称为感受性曲线(sensitivity curve)。得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而已。为了了解ROC曲线的意义,我们首先得了解一些变量。以下定义引自维基百科
最近在做一些分类的任务,评价中的ROC曲线在很多地方都会用得到,特别在论文中。在此记录一下在做ROC曲线的过程中遇到的一些坑。
1.画出来的ROC曲线是只有一个拐点的曲线
更极端的像上图这种直接是一条曲线,这是因为在计算fpr与tpr过程中,会使用到数据的真实标注以及模型的预测结果,在计算fpr与tpr以及阈值时,preds的值应该使用分类器输出的概率值,而不是准确的分类结果0/1。
输出的图像不过原点
就像上图一样,输出的图像看起来不经过远点,将坐标轴的刻度设置的大一些,为[-0.05,1.05]即可。
分类器如何输出概率
SVM分类器中,将参数probability=Tru