博士论文——基于卷积神经网络的人脸识别研究 __张燕红

本文深入研究了基于卷积神经网络(CNN)的人脸识别技术,提出了两种创新方法。首先,通过在线分块策略和多分支CNN结构,提取互补的局部和全局特征,增强了模型对遮挡、姿态、表情和光照变化的鲁棒性。其次,引入基于核函数的去相关性正则化,减少参数冗余,提高模型的泛化性能。实验结果表明,这两种方法在人脸识别任务中取得了显著的改进。
摘要由CSDN通过智能技术生成
论文题目 作者 年份 关键词 链接 备注
基于卷积神经网络的人脸识别研究 张燕红 2018 人脸识别;卷积神经网络;特征提取;分块策略;正则化 博士论文

摘要:随着信息技术的蓬勃发展,人们的学习和生活方式都发生了深刻的变化,公共安全日渐成为大家关注的焦点问题。生物特征识别技术由此应运而生,尤其是其中的人脸识别技术。相较于指纹识别、虹膜识别等其他生物识别技术,人脸识别具有采集方式友好、较少需要或不需要人的配合、应用操作简单、隐蔽性好等优点。在日常生活的方方面面如公共安全、金融安全等,人脸识别具有广阔的应用前景,是当今安全技术中热门的研究课题。计算机技术的高速发展更是将人脸识别的研究推向白热化。
      长期以来,遮挡、光照、表情、姿态等问题一直是人脸识别的难点所在,建立对这些干扰不敏感的描述模型是当前人们面临的一项艰巨而迫切的任务。深度卷积神经网络模型的出现在很大程度上改善了人脸识别的现状。相比于传统的人脸识别方法而言,深度神经网络模型不需要人工地进行复杂而耗时的特征提取,只需搭建一个有效的网络框架便可实现自适应的自动学习。目前,深度神经网络模型已经成为最受欢迎的人脸识别研究方法,能很好地应对当前大数据的快速积累,并在实际场景中取得了成功的应用。本文借助深度神经网络模型,在不增加数据规模的情况下,就如何进一步提高网络模型的表达能力、提取更加有效的人脸判别特征等问题展开了以下的研究工作:
      (1)提出了基于分块策略的深度人脸识别方法。该方法的核心是将分块策略( patch strategy)嵌入卷积神经网络( convolutional neural network,CNN)以提取出互补、高效的特征。为此,该方法构造了一个新的网络层用来实现分块策略的嵌入操作,并搭建了一种多分支的网络模型结构实现了在线分块、多特征提取和特征融合的端到端的学习。
       卷积神经网络通常以整幅图像作为输入数据,提取人脸的全局特征描述。全局特征描述具有较强的判别性能,但容易忽视对人脸细节的把握,容易受到局部变化的影响。为了加强提取特征的有效性,弥补全局特征的不足之处,一种简便而直接的做法就是引入局部特征。相对全局特征而言,局部特征更注重对局部细节的刻画,对人脸中存在的遮挡、光照、姿态等因素不敏感,与全局特征形成互补。分块策略正是获得局部信息的有效途径之一。以此为契机,基于分块的多分支网络模型被提出。该方法选取了人脸的 5 个关键点(两个眼睛的中心,鼻尖和两个嘴角)进行定位,按照平均采样的原则裁剪出 6 个人脸块。之后,将每个人脸块送入一个网络分支进行特征提取。最后,提取出的各个特征经过归一化处理后又被进一步融合。相较于基于分块的多模型方法,该方法提出的分块策略的嵌入操作实现了线上分块,不需要额外的存储空间储存各个人脸块。更重要的是,这种方法采取端到端的方式对分块、特征提取和特征融合三个过程进行同步操作,可以进一步促进局部信息和全局信息之间、各局部信息之间的相互作用,使得多种特征自适应地被不同程度的削弱或加强,从而强化了最终的特征表示的判别性和有效性。在两个基准的人脸数据库 LFW 和 YTF 上的实验显示,该方法的识别效果优于基于分块的多模型方法,且在对遮挡、姿态、表情和光照四种变化的处理上表现出一定的优越性。
       (2)提出了一种基于核函数和去相关性的 CNN 正则化方法。针对 CNN由于过拟合导致的模型的泛化性能下降的问题,采用有效的正则化方法能够很好地缓解这一问题。考虑到存在过拟合问题的 CNN 模型往往含有大量的参数冗余,这些冗余的参数通常以非常相似的模式捕捉数据中的信息,具有较强的相关性。该方法从正则化的角度出发,结合核函数的思想,通过去除参数间的相关性来正则化网络参数,从而保证了编译信息的最大化。
       相较于去除每维特征之间的相关性的做法,该方法直接对网络参数进行去相关性操作,大大地缩减了计算量,因为 CNN 输出的特征一般具有较高维数。鉴于核函数是特征空间的内积,本质即相似度,该方法利用高斯核函数来度量参数向量的相关性,既利用了向量之间的角度,又引进了距离远近对相关性强弱的影响。高斯核函数的值越大,两个参数向量之间的相关性越大。由于高斯核对核的宽度比较敏感,该方法在模型的训练过程中,根据当前迭代的参数间的平均距离自动地调整核的宽度。该方法与其他的正则化方法如 Dropout、 BatchNorm 等有着很好的兼容性,它们一起使用时,识别效果甚至会得到更大程度的改善。并且,该方法适用范围广,它对复杂度不同的网络模型的泛化性能都有不同程度的提升。大量实验结果表明,该方法在物体识别和人脸识别的多个数据库上都展现出很好的识别效果。相较于其他的基于去相关的正则化方法,该方法在不同的识别任务上具有明显的优势,尤其是对于大规模的图像识别如人脸识别。

关键词: 人脸识别;卷积神经网络;特征提取;分块策略;正则化

一、绪论

1.1 人脸识别的研究背景与研究意义

1.2 人脸识别的国内外研究现状

1.3 人脸识别系统

       一个完整的人脸识别过程一般包括人脸检测、人脸图像预处理、特征提取、识别或认证四个组成部分;

  1. 人脸检测:就是在图像中准确标定出人脸的位置和大小。作为人脸识别的一个组成部分,人脸检测在实际中主要用于后续的预处理阶段。
  2. 人脸图像预处理:原始图像在采集时会受到相机噪声、光照、形变等多种因素的干扰,对图像进行预处理可提高人脸图像的对比度和亮度,减少外部条件的影响,从而提升最
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值