VlFeat_vl_pr画图解析

This tutorial illustrates the use of thefunctions vl_roc, vl_det, and vl_pr to generate ROC, DET, and precision-recallcurves.

ROC curves-vl_roc:

tpr(k):scores按降序排列,排名小于或等于K-1的正样本占所有正样本的比例。tnr(k):排名大于K的负样本占所有负样本的比例。(与维基百科上描述的不一样(fpr=1-tnr)两者都应该可以见下图),如果按K作为正负样本的分界,tpr(k)和tnr(k)分别代表正负样本被正确分类的概率。如果从k-k+1,第k+1是正样本,那么tpk上升,否则tnk下降。

曲线是怎么得到?通过不断改变K,由以上计算对应的tpr和tnr。

曲线有什么作用?ROC曲线是用来评估检索效果的,tpr相当于召回率,而fpr就相当于得到这个召回率付出的代价,因为召回率高,那么导致假阳性率高。


EER(Equal ErrorRate):ROC 曲线上的一点,这点对应有误分正负样本的概率相同。可以通过y=x这条线和ROC曲线的交点得到。

Precision-recall curves----vl_pr:

PR 曲线直接反应正负样本的比例,而ROC和DET规范了这些比例。

调用格式:vl_pr(labels,scores)

横纵坐标代表precision(k):排名小于等于k 的样本是正样本的比例。recall(k): 排名小于等于k 的正样本是占所有正样本的比例,For example, if the first two samples are one positive and one negative,precision(3) is 1/2. If there are in total 5 positive samples, then recall(3)is 1/5.

变化趋势:k到k+1,k+1是正样本,PR都上升,反之,P下降R不变。

 

AUC:AOC曲线下的面积,AUC面积等于1,完美分类器,=0.5随机分类器。

AP:平均正确率(Average Precision, AP):对不同召回率点上的正确率进行平均
1)未插值的AP:某个查询Q共有6个相关结果,某系统排序返回了5篇相关文档,其位置分别是第1,第2,第5,第10,第20位,则AP=(1/1+2/2+3/5+4/10+5/20+0)/6
2)插值的AP:在召回率分别为0,0.1,0.2,…,1.0的十一个点上的正确率求平均,等价于11点平均
3)只对返回的相关文档进行计算的AP,AP=(1/1+2/2+3/5+4/10+5/20)/5,倾向那些快速返回结果的系统,没有考虑召回率

AP11:211点平均正确率(11 point average precision):在召回率分别为0,0.1,0.2,…,1.0的十一个点上的正确率求平均,等价于插值的AP

红线代表:随机分类器的情况下得到的PR曲线,PR  rand,跟测试中的正负样本的个数有关。比如上图,正样本110,负样本1326,精确度为110/(110+1326)=0.0766,不管召回率怎么变。

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值