深度学习大讲堂（一）

最新推荐文章于 2022-09-29 12:43:48 发布

twinkle_star1314

最新推荐文章于 2022-09-29 12:43:48 发布

阅读量3.5k

点赞数

SeetaFace开源人脸识别引擎介绍

代码基于C++实现，且不依赖于任何第三方的库函数，开源协议为BSD-2,可供学术界和工业界免费使用。

SeetaFace人脸识别引擎包括了搭建一套全自动人脸识别系统所需要的三个核心模块。即：人脸检测模块SeetaFace Detection、面部特征点定位模块SeetaFace Alignment以及人脸特征提取与对比模块SeetFace identification.SeetaFace Detection采用了一种结合了一种传统人造特征与多层感知机（MLP Multilayer Perception）的级联结构。在FDDB上达到了84.4%的召回率（100个误检时），并可在单个I7CPU上实时处理VGA分辨率的图像。SeetaFace Alignment通过级联多个深度学习模型（栈式自编码网络）来回归5个关键特征点（两眼中心，鼻尖和两个嘴角）的位置。在AFLW数据库上达到state-of-the-art的精度，定位速度在单个I7 CPU上超过200fps.

MLP:是一种前馈人工神经网络模型，其将输入的多个数据集映射到单一的输出的数据集上。SeetFace identification采用一个9层的卷积神经网络（CNN）来提取人脸特征，在LFW数据库上达到97.1%的精度。SeetaFaceNet开园的人脸特征提取模块也是基于卷积神经网络的。具体地说，其实现的是深度卷积神经网络VIPLFaceNet:一个包含7个卷积层与2个全连接层的DCNN。其直接修改自Hinton教授的学生Alex Krizhevsky等于2012年设计的AlexNet(即引爆CNN在视觉中广泛应用的网络).VIPLFaceNet将5*5的卷积核拆分为两层3*3的卷积核，从而增加了网络深度，而并没有增加计算量；VIPLFaceNet还减少了每个卷积层的kernel数目以及FC2层的节点数。同时，通过引入Fast Normalization Layer(FNL),加速了VIPLFaceNet的收敛速度，并在一定程度上提升了模型的泛化能力。测试表明，在相同训练集情况下，VIPLFaceNet在LFW测试集上识别错误率比AlexNet 降低了40%，而训练和测试时间分别为AlexNet的20%和60%

VGA分辨率：VGA分辨率就是640*480

LFW(Labeled Faces in the Wild)人脸数据库。