数据挖掘中的ROC曲线

基本术语

  •   真阳性(TP, true positive):预测为真,实际上也为真。
  •   伪阳性(TN, true negative):预测为真,实际却为假。
  •   真阴性(FP, false positive):预测为假,实际上也为假。
  •   伪阴性(FN, false negative):诊断为假,实际却为真。

1、真正率(TPR, true positive rate),即命中率

    TPR = TP / P = TP / (TP+FN)

2、假真正率(FPR, false positive rate),即错误命中率、假警报

     FPR = FP / N = FP / (FP + TN)

3、准确度(ACC, accuracy)

     ACC = (TP + TN) / (P + N)

 

roc空间

  ROC空间将伪阳性率(FPR)定义为 X 轴,真阳性率(TPR)定义为 Y 轴。也即是一个(0,0)到(1,1)的二维坐标空间。

例如:

  一个二元分类器,对于一个样本数为N的样本空间,每个样本x被预测为真(1)的概率为P(x)。即选择一个阈值P(0),

使得P(x)>P(0)的样本被预测为真(1),且样本数为m。而实际该样本空间中,表现为真(1)的个数为n。这样就得到,

TPR = m/n,FPR = (N-m)/(N-n),即在roc空间中,该点表示为(m/n,(N-m)/(N-n))。

 

roc曲线

根据上述描述关于roc空间的原理,通过改变不同的阈值P(k),k=0,1,2···k。根据

P(x)>P(k)得到m(k),即可得到点(m(k)/n,(N-m(k))/(N-n)),从而在roc空间里绘出roc曲线。

 

 

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值