近日,维识科技智能工程教育中心开展了一场别开生面的人脸识别技术知识公开课。本次公开课主讲人为维识教育科技金牌讲师揭李迪。
揭sir简介:本科毕业于谷歌首席科学家Geoffrey Hinton(图灵奖获得者,被称为“神经网络之父”、“深度学习鼻祖”)的母校爱丁堡大学(Edinburgh University)。研究生师从香港浸会大学(HKBU)国际电子电气工程协会(IEEE)院士刘继明(jiming LIU)。曾经担任融链科技项目总监、金力软件项目经理。参与了公安部旗下与商汤竞标的闭路摄像头人脸检测项目。精通物体检测语义分割NLP自然语言处理与AI项目全栈落地WANN无权重机器人等国内外领先技术。
人脸识别其实是对人脸特征进行分析计算并进行身份识别的一种生物识别技术,即用摄像机或摄像头采集含有人脸的照片或视频对其中的人脸进行检测和跟踪进而达到识别、辨认人脸的目的。
人脸识别技术发展到今天,主要有两种用途:
①人脸验证:人脸验证做的是1:1的比对。也就是说我们先告诉人脸识别系统,我是张三,然后用来验证站在机器面前的“我”到底是不是张三。
②人脸识别:人脸识别做的是1:N的比对。也就是说系统采集了我的一张照片之后,从数万人或者数百万人的库里自动找出“我是谁”。
而“刷脸”只是人脸识别中比较具体可感的一部分,事实上人脸识别能够给大家带来的远远不仅是“刷脸”付款这么简单。
目前,人脸识别技术在金融、安防、交通、电子商务、娱乐等领域均有着广泛应用。
了解了什么是人脸识别之后,那么问题来了——它是怎么实现的呢?
关于人脸识别目前有很多经典的算法:基于几何特征法、局部特征分析法、基于弹性模型法、特征脸法及神经网络法等
神经网络方法在人脸识别上的应用比起前述几类方法来有一定的优势,因为对人脸识别的许多规律或规则进行显性的描述是相当困难的,而神经网络方法则可以通过学习的过程获得对这些规律和规则的隐性表达,它的适应性更强,一般也比较容易实现。
卷积神经网络(CNN)的前级包含了卷积和池化操作,可以实现图片的特征提取和降维,最近几年由于计算机算力的提升,很多人都开始转向这个方向。
所以,本次公开课,揭sir以CNN为技术背景,介绍了人脸识别的基本思路:
先用人脸检测方法检测出人脸位置,然后根据返回的坐标、尺寸把脸用数组切片的方法截取下来,然后把截取的小图片送进训练好的卷积神经网络模型,得出人脸的分类结果,最后在原图片上打上包围框并且把结果写在包围框的上端。
当然,实现以上步骤的前提是有一个训练好的可以做人脸识别的模型。因为训练的好坏直接影响识别的准确度。
所以,本次课程的重点放在了训练上,揭sir简述了从LeNet到VGG-Nets的网络架构演进。