ROC曲线及其绘制

 真正类率(true positive rate)                        计算公式 TPR = TP/( TP+FN) 

 TP : 正确肯定的数目                                   FN:漏报,没有正确找到的匹配的数目。

指的是分类器所识别的,正实例占所有正实例的比例。

负正类率(false positive rate)                        计算公式 FPR = FP/(FP+TN)

计算的是分类器错认为正类的负实例所占实例的比例。

ROC曲线的横纵坐标分别为负正类率,真正类率。

ROC曲线用于评价一个分类器,如果说已确定了一个阈值,那么大于这个阈值的实例就归为正类,小于这个值就归为负类。

ROC曲线指受试者工作特征曲线 / 接收器操作特性曲线(receiver operating characteristic curve), 是反映敏感性和特异性连续变量的综合指标,是用构图法揭示敏感性和特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标、(1-特异性)为横坐标绘制成曲线,曲线下面积越大,诊断准确性越高。在ROC曲线上,最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。

在理想情况下,TPR应接近1,FPR应接近0,ROC曲线上的每一个点对应一个阈值,对于一个分类器,每个临界值下会有一个TPR和FPR。当threshold最大时,TP=FP=0 对应于原点,threshold最小时,TN = FN =0,对应于右上角的点(1,1)。随着阈值的增加TP和FP都减小ÿ

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
ionosphere数据集是一个二分类问题的数据集,主要是针对天气雷达的电离层特征数据。该数据集一共有34个特征变量,其中前33个是预测变量,第34个是类别变量,类别变量为g和b两类,分别代表天气雷达测得的信号穿过电离层和未穿过电离层两种情况。ROC曲线是评估分类器性能的重要工具之一,能够同时考虑分类器的灵敏度和特异性。 要绘制ionosphere数据集的ROC曲线,首先需要将数据集导入MATLAB并划分为训练集和测试集,可以使用MATLAB中的readtable函数读取数据集,再使用fitcsvm函数拟合支持向量机分类器,并使用predict函数对测试集进行预测。接下来,需要计算分类器的真正率和假正率,真正率是指正确分类为正样本的样本占所有正样本的比例,假正率是指将负样本误分类为正样本的比例。然后,使用MATLAB中的perfcurve函数可以方便地计算并绘制ROC曲线。此函数中需要传入真正率、假正率及其阈值,将roc曲线直接绘制出来。 在绘制ROC曲线的同时,还可以计算分类器的AUC值,即曲线下的面积,其值越大表示分类器性能越好。使用MATLAB中的auc函数可以直接计算AUC值。 绘制ionosphere数据集ROC曲线,可以借助MATLAB提供的强大的函数库,在MATLAB中导入数据集后进行分类器训练和测试,计算真正率和假正率,并使用perfcurve函数绘制曲线,同时计算并输出AUC值,以便对分类器性能进行评估。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值