precision——recall曲线在模式识别和分类问题论文中很常见,定义维基百科已经给的很清楚了,它能较好的反映分类器的性能但是画起来却没有想象中的容易,我们选定一个分类阈值,再次阈值下统计到如下数据
正确检测到的有多少,
错误检测的有多少,
漏检的有多少
真实有多少个
我们能很容易的算出正检率和误检率,以及漏检率但是只是一个点,不能构成曲线,曲线如何绘制呢?
要绘制PR曲线要准备如下数据,
1,每一类有多少个
2,每一类的实际标号,一次排列
如下
1
1
1
2
2
2
。。。
3,预测标号,格式同2但是按照实际预测的标号记录
4,每一类的决策值(将分类器应用于所有受测样本后的得分值)。
有一个matlab工具箱可以完成roc曲线,PR曲线以及混淆矩阵的绘制。