【论文阅读】Alignment-Free Cancelable Iris Biometric Templates based on Adaptive Bloom Filters

1.Introduction

刻意、重复的变形->使得可以在变换域内比较

分类:不可逆变换(non-invertible transforms)和生物特征方法(biometric salting)。

两个生物特征信息保护要求:1.不可逆性        2.不可链接性       

基于布隆过滤器的可撤销生物特征的解决方法:1.从存储的布隆过滤器重建的原始生物特征模板是不可用的。        2.结合特殊应用的密钥,例如种子值。

但是满足这两个要求识别性能会下降。有两个原因:(1)特征元素的局部邻域被遮挡,(2)转换后的注册模板不可见,即在比较时不能正确地执行对齐。

布隆过滤器的应用目的是实现免对齐的、可撤销的生物特征模板。

2.相关研究

Ratha et al.首次提出可撤销的生物特征,用了基于图片的块置换和表面折叠。为了保持基于循环位移位的所得虹膜代码的计算效率对齐,虹膜纹路和虹膜编码以行方式被遮挡,这意味着相邻的像素点和比特位在图像和特征域中沿x轴保持。

在[6]中,块重映射和图像转换被归一化虹膜纹路。对于这两种类型的转换方法,虹膜编码的适当对齐是不可用的,这导致生物特征识别性能的极度降低。

在[3]中,许多注册模板被处理来获得一致比特位的向量,根据受试者特定随机种子编码iris-code实现可撤销性,在这种情况下,为了实现可撤销的生物模板运用了受试者特定转换,在类间比较期间,这些转换必须被认为是受损的。受试者特定的密码,无论是转换参数,随机数或任何类型的密码都很容易被泄露,即性能评估必须在被盗密码的场景下执行,每一个冒名者都有有效的密码。

在[14]中,可取消的虹膜模板是通过对虹膜图像进行扇区随机投影(一降维的方法)来实现的。而且识别性能只有在应用受试者特定的随机矩阵时才能保持。 

在[4]中,不可逆虹膜编码是通过对特征向量与随机生成的向量的内积进行阈值处理来计算的。随机向量是使用每个受试者的密码和一个伪随机数生成器产生的。

在[5]中,几个归一化的虹膜纹理与随机核相乘以产生隐藏的特征向量。

绝大多数不可逆变换只对安全性有疑问的设置保持生物统计性能,例如[20]中虹膜纹理条纹的行式排列和移位,或[6]中512×64像素纹理内32×32像素块的排列。

在生物测定盐化的方法中,例如在[4,13]中,结合特定于受试者的密码,同时在忽略系统的实际生物测定性能的非被盗秘密情况下执行实验。

3.系统结构

3.1 基于布隆过滤器的特征转换

S集合={x1,x2...xm},hash function h1,h2...hk,可以用bloom filter映射得到b1,b2...bk个集合,b.len = n = 2^w。

test y is in S,check whether hi(y) in b are set to 1.如果满足则可能在,如果不满足则肯定不在。因此要可以接收误报率。

普通的虹膜识别系统提取从归一化虹膜纹理的行式分析中产生的二进制特征向量(虹膜编码),即虹膜代码代表二维的二值特征向量,宽为W,高位为H。被分为同等大小的K block,每个块的整个列序列(每列w bits)被连续变换到布隆过滤器内的相应位置。有K个布隆过滤器n = 2^w,形成大小为K*2^w的保护模板(每一块用不同的过滤器模板b)。

因此隐藏了码字(字长w = 6)的原始位置(不知道是第一个还是第n个?),不同的列被映射到单个索引,并且不同码字的出现不能从受保护模板建立。

 secret T实现不可链接性,T是长度为w的向量,和每个码字做异或运算。

免对齐就是可撤销生物模板(全部布隆过滤器K*2^w)在比较的时候不要对齐。

传统的虹膜识别系统将检测到的虹膜纹路转换为极坐标,因此,虹膜代码的循环行式移位与眼睛的方向一致。

3.2 在转换域中比较

汉明距离表示两个特征图像检测出的不一致,HD是两个向量比较的不同位数,除以比较的向量bit为1的总位数得到相异度DS函数:

 如果只通过估计布隆过滤器对之间的汉明距离来比较这些布隆过滤器对,则其中较少比特被设置为1的布隆过滤器之间的不匹配比特将被更少地加权,反之亦然。为什么要这样呢??????

DSS的计算效率与HDS一样高,不考虑任何屏蔽位(按位与运算,用0 屏蔽不要的位)

3.3 不可逆性和不可连接性

限制 l ≤ n,n = b.len,b中一个bit被置1的概率是1 / n,仍然是0的概率是1 - 1 / n,l 个全部插进去则是1的概率为1 - (1 - 1 / n)^l。令n = l*c,,由于生物特征向量不是独立的,因此这个理论预期不会实现。

平均熵(即相互独立的bits数量)用自由度来评估,定义,p是HD的均值,伊普西隆对应如下图

长度为z的二值特征向量就相互独立

 比较不同特征向量会产生二项式分布

 汉明距离是,X和Y是独立的随机变量{0,1}

实际上p会降低到0.5 - ε

码字的高度统一导致许多码字映射到相同的位置上,重映射到同一bit位上的概率为1 - |b|/l,由于|b| < l,理论上攻击者想要重建的原始虹膜编码的可能性为

可能性以对数规模增长,高峰在 3l / 4 的位置

 

 不可链接性用T∈{0,1}^w来实现,不同的哈希函数可以应用在不同领域,同一个哈希函数可以基于不同的特殊应用种子,实验证明随机生成的向量让攻击者不能跨域匹配。

4.实验研究

在目标误匹配率(FMR)和等错误率(EER)下,用false non-match rate (FNMR)【即是同一个样本,本来要匹配,实验结果却不匹配】评估性能,FMR是本来不是同一个样本实验结果却匹配。EER即当FMR=FNMR的值。

4.1 实验装置

使用 CASIA-v3-Interval iris database,只有左眼数据。预处理展开为增强的512*64像素图像(两阶段分割算法采用加权自适应Hough变换迭代细化感兴趣区域以找到初始中心点),利用极坐标转换的图像提取极端边缘曲线得到椭圆。

特征提取阶段:采取两种不同虹膜识别算法,归一化虹膜纹理被分成条纹获得10个一维信号,每一个都是5个相邻行的平均(分析上面512*50行)。

第一个特征提取方法是Masek的,应用Log-Gabor函数,这个方法纹理被分成10个条纹获得5个一维信号(上面512*50行)。在纹理像素上执行具有复Log-Gabor滤波器的逐行卷积。

 每个像素的结果复数值的相角被离散成2比特。2比特的相位信息被用来生成二进制码,因此该二进制码再次是512×20=10240比特。

一个二元的小波变换应用在10个信号向量上,从转换结果的20个子带中选择两个固定子带,在每个子带中,定位高于适当阈值的所有局部极小值和极大值,并在每个极值点提取在0和1之间交替的比特码。虹膜代码通过两个特征提取办法生成。

两个办法的汉明码的二值分布:

 1D Log-Gabor特征提取方法共获得592个自由度,平均值为0.493,相应的标准差为0.021。

Ma et al.特征提取方法共获得1291个自由度,平均值为0.498,相应的标准差为0.013。

特征对齐是比较过程中的一项基本任务,性能展示如下:

 显然正确对齐会提高生物特征性能,8个循环位移是正确的选择。

4.2 性能评估

各自从不同的波带中提取实数和复数或者最小最大值,在基于列式码字估计HD的情况下,即两个码字之间的单个误差定义了不匹配,FNMR随码字的大小略有增加,而EER增加得相当快。

 其中码字开始于上半部分和下半部分的顶部,并且原始生物测定性能对应于字大小w=1。

相邻的虹膜编码列有高相关性,具有高相关性的列被表现出相当低相关性的列包围,即,从估计的自由度中,由Ma等人的算法提取平均虹膜编码。对应于1291个伯努利试验,这意味着0和1的串联序列展示。w的平均约等于8 (10240/1291) bit。1D Log-Gabor约等于17(10240/592)bit。

不同的w和l的性能比较:

 分的块数越少甚至性能提高了,证明了初始未对齐不会导致生物测定性能的急剧下降。

性能最好是在word size最大为10 bits的时候。

此时的分块如下:

通过将代表改进的生物特征比较器的DS度量应用于Bloom Filters对,在保护原始生物特征模板的同时获得了精度。

关于大多数配置的结果模板大小K*2^w<10*2^10,这意味着实现了对原始模板的压缩。

4.3 安全分析

全部方法的安全性都来自不可逆的布隆过滤器映射。

重映射的平均百分比,算法和应用配置的标准差,根据图[3]重映射1 - |b| / l ≈ 1 - 3 / 4 = 25%是最优的(因为当|b| = 3 * l / 4 时,逆运算得到的初始iris-code的可能性最多)

两个算法的重映射概率:

 w = 9和w = 10,越小的block size反而重映射更多,这是由虹膜码列之间的相关性引起的。对于w = 8重映射的数量随着 l 的增大而增加,即与更大的w相比来说丢失更多的信息。

总的来说与不丢失关于码字位置的信息的情况(参见表2)相反,生物特征性能随着w的减小而降低。

显然,可取消的生物识别系统是通过在安全性和生物识别性能之间进行自然权衡来操作的。

4.4 不可链接性研究

许多方法忽视了不可链接性,比如fuzzy vault就有很强的脆弱性。

用最好性能的配置参数研究(就是上面的研究参数),所获得的类内分布和同一个虹膜编码用不同向量产生的布隆过滤器分布进行比较,结果相异的分数明显高于类内分布。

 5. 总结和未来的工作

由于基于Bloom Filter的生物特征表示不需要模板对齐,因此可以将其应用于一系列有效的特征提取组合,以加速生物特征识别。此外,如果可能建立Bloom Filter的排序,这些可以用作模糊散列,以便索引生物特征数据库。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值