1、人脸识别的相关介绍
(1)流程:人脸图像采集 人脸检测 人脸关键点定位 特征提取 分类器(人脸比对)。
(2)特征提取阶段的区别:
DL之前:主要采用通过Gabor、LBP、SIFT等方法人工提取的局部特征,然后使用PCA等方法进行特征转换。
DL时代:使用多层卷积自动提取更加抽象的特征。
(3)人脸数据库
受控数据库:ORL、AR等。
非受控数据库:LFW等。
强监督:经过预处理的人脸数据。
弱监督:实际情况下的人脸数据。
(4)活体检测是人脸识别应用中的一个非常重要的模块,其目的是判断真人操作,排除图片、视频的恶意攻击。
2、基于深度学习的人脸识别
2.1 网络结构
(1)DeepFace(Facebook): 8层网络,4030人的440万张图片,对3D人脸进行正面化预处理。(其具体使用的方法在博客中有具体的描述 http://dataunion.org/20010.html )
(2)FaceNet(Googe): 22层网络,海量数据(800万人,2亿张图片),Triplet Loss(http://blog.csdn.net/tangwei2014/article/details/46788025)。
(3)Linkface公司使用多层的DCNN,进行性别、年龄、表情等的识别。
(4)弱监督人脸识别:对于来自网络爬虫、人工采集的百万级别的特征点标注不准确的数据的整理,提出了一种可行的方案,即首先通过机器自动筛选进行标注,然后进行人工辅助标注(玉米病害图像的类别的标注)。
(5)轻量级网络人脸识别的网络结构:
Ø 4层卷积
Ø 5层卷积+4层全连接
(6)SPAE(poster):使用了有三个隐层的深度学习结构,调参使用共轭梯度法(优势:存储量小、稳定性高、不需要任何外来参数)。
2.2 小结
(1)对于深度学习的训练,大规模的数据集越来越重要。
(2)大规模数据的标注是一个具有挑战的难题,可通过弱监督的标注方法来解决。
(3)当数据量不足时,使用现有数据以及部分人工设计的特征共同进行训练。
(4)人脸识别使用CNN居多,一是CNN直接接受图像作为输入,二是其权值共享的网络结构降低了模型复杂度,减少了参数的数量。但是,对于结构化数据集,其输入相对于图像来说,是一种更有效的特征,使用CNN进行预测或者分类的效果如何,有待进一步考证。
(5)如果可以找到一个评价指标来判断该层提取的特征是否更加有效,则可以更好的确定层数。
3、京东客服机器人
介绍了JIMI的功能以及其使用深度学习等智能算法进行用户意图识别。其中使用word2vec(安装以及使用:http://blog.csdn.net/heyongluoyao8/article/details/43488765)将文本信息转化为向量或者矩阵。
4、指纹识别算法
主要介绍了从专利中学习一些比较先进的指纹识别算法。
注:上文图片是从相关论文中截取的。