之前对FAR 值的认识总是比较浅显,我总是很懒,不是必须要做这个事情的时候,都会装看不见。
设定一个分数阈值T,FAR=非同人分数>T/非同人比较的次数,FRR=同人比较分数<T/同人比较的次数。即FAR和FRR都是一个关于T的函数
一般,FAR=0.001时,FRR的值作为参考。值越小,性能越好。
我之前的理解是同人的比较次数,啪啪啪打脸。因为解释不下去。
以JL 的数据为例,给了5000个人,能检测到人脸的是4683 个人。
那么我们同人的数据是4683个
非同人的次数是:(4683*4682)/2=10962903 上千万的数据量
那么我们FAR=0.001 时 对应一个阈值T为:0.4540 那么大于0.4540 的个数为为10962903*0.001 个样本
那么我们FAR=0.0001时,对应的阈值T为:0.5507 那么大于0.5507 的个数为10962903*0.0001 个样本
我们不难理解为什么FAR=0.0001 时的阈值比FAR=0.001的阈值大。(因为非同人样本被错分的少了)
我们给JC 的阈值参考值为:0.3
那么我们计算得到:同人通过的数量为:4298 4298/4883=0.9178
非同人通过的个数 165897 165897/10962903=0.0015
那么如果阈值设置为0.3 这个人拿着自己的身份证刷的概率是:
0.9178/(0.9178+0.0015)=0.9984
意思是这个人拿自己身份证刷的概率是99.84%
通过但是不拿自己身份证的概率是100-99.84 的概率
顺便统计下得分的分布情况: