ROC曲线典型特征是Y轴为真阳性率,X轴为假阳性率。这意味着图的左上角是“理想”点——假阳性率为0,真阳性率为1。这不是很现实,但它确实意味着曲线下更大的区域通常更好。ROC曲线通常用于机器学习二元分类,用于研究机器学习分类器的输出。为了将ROC曲线和ROC面积扩展到多类或多标签分类,需要对输出进行binarize。每个标签可以绘制一条ROC曲线,但也可以通过将标签指标矩阵的每个元素作为二元预测来绘制ROC曲线。将输入样本的预测类概率计算为集合中分类器的加权平均预测类概率。使用Python我们可以导入SkLearn库。用户可以安装Anaconda for Python3并立即开始使用。
在我们的示例中,我们将使用机器学习Python库(scikit)检测是否检测到了类1或类2。在这个例子中,我们将使用支持向量机(SVM)分类器。请创建一个python文件并测试代码。首先,我们必须导入我们的库。
from sklearn.svm import SVCfrom sklearn.metrics import roc_curvefrom sklearn.metrics import aucimport matplotlib.pyplot as pltimport numpy as np
在将标签与.txt文件中的特征分离之后,我们必须创建多个列表。在我们的用例中,我们使用一个列表,然后将它转换成numpy数组。#READ TRAINING AND TESTING FILEfeatureFile = input('Enter Training File: ')featureTestFile = input('Enter Test File: ')featureFile = open(featureFile, 'r')featureTestFile = open(featureTestFile, 'r&#