curve函数 roc_python实现二分类和多分类的ROC曲线

最新推荐文章于 2024-03-21 14:31:05 发布

weixin_39996096

最新推荐文章于 2024-03-21 14:31:05 发布

阅读量1.1k

点赞数 1

文章标签： curve函数 roc

本文链接：https://blog.csdn.net/weixin_39996096/article/details/112317449

版权

本文详细介绍了ROC曲线图中的关键点和特殊线，并探讨了ROC曲线如何随着分类器阈值的变化而变化。通过Python的sklearn库展示了二分类和多分类问题中ROC曲线的绘制，包括宏观平均和微观平均两种方法，同时提供了实例代码和ROC曲线图示。

摘要由CSDN通过智能技术生成

reference: https://blog.csdn.net/xyz1584172808/article/details/81839230?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param

ROC曲线图中的特殊点和线

（1）ROC曲线图中的四个点

第一个点，(0,1)，即FPR=0, TPR=1，这意味着FN（false negative）=0，并且FP（false positive）=0。这是一个完美的分类器，它将所有的样本都正确分类。第二个点，(1,0)，即FPR=1，TPR=0，类似地分析可以发现这是一个最糟糕的分类器，因为它成功避开了所有的正确答案。第三个点，(0,0)，即FPR=TPR=0，即FP（false positive）=TP（true positive）=0，可以发现该分类器预测所有的样本都为负样本（negative）。类似的，第四个点（1,1），分类器实际上预测所有的样本都为正样本。经过以上的分析，，ROC曲线越接近左上角，该分类器的性能越好。

（2）ROC曲线图中的一条特殊线

考虑ROC曲线图中的虚线y=x上的点。这条对角线上的点其实表示的是一个采用随机猜测策略的分类器的结果，例如(0.5,0.5)，表示该分类器随机对于一半的样本猜测其为正样本，另外一半的样本为负样本。

2. 如何画ROC曲线

对于一个特定的分类器和测试数据集，每一个实例都会得到一个分类结果，通过统计，利用上述公式，可以得到一组FPR和TPR结果，而要得到一个曲线，实际上需要一系列FPR和TPR的值。那么这一系列值是怎么构造出来的呢？

在ROC曲线的定义中，有“as its discrimination threshold is varied.”这样一句话，而在本文最开始也提到了分类器的结果可以是“概率输出”，即表示分类器认为某个样本具有多大的概率属于正样本（或负样本），于是如果设置不同的threshold，那么分类结果就会有所变动，因此可以得到一系列FPR和TPR的值。

接下来就是利用python实现ROC曲线，sklearn.metrics有roc_curve, auc两个函数，本文主要就是通过这两个函数实现二分类和多分类的ROC曲线。

fpr, tpr, thresholds  =  roc_curve(y_test, scores) 
# y_test is the true labels
# scores is the classifier's probability output

其中 y_test 为测试集的结果

最低0.47元/天解锁文章

weixin_39996096

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
curve函数 roc_python实现二分类和多分类的ROC曲线

reference: https://blog.csdn.net/xyz1584172808/article/details/81839230?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param&depth_1-utm_source=distribu...
复制链接

扫一扫