格灵深瞳算法团队获得NIST人脸识别竞赛全球第一

点击上方“深度学习技术前沿”,选择“星标”公众号

资源干货,第一时间送达

作者:Devymex Wang

https://zhuanlan.zhihu.com/p/101683776

本文已由作者授权,未经允许,不得二次转载

NIST FRVT称得上是全球最权威的人脸识别竞赛,我有幸也参与到了这项比赛中。几个月准备过程中的各种痛苦和折磨,最终也都转化成了优异的成绩,算是一种安慰吧。下面介绍一下比赛的基本情况。

该比赛是由美国国家标准委员会举办,面向全球人脸算法供应商,接受算法提交,进行保密测试后在NIST官网上发布成绩和排名,每三个月举办一轮并刷新榜单。比赛分为四个大项,分别为1:1(识别),1:N(识别+检索),Morph(伪造识别)和Quality(质量评估)。最受广泛关注的就是 1:1 和 1:N 两项比赛,国内许多人脸别团队都有参加,包括商汤、旷视、依图、海康、大华等,当然也包括迟到的我们 :D

其中 1:1 人脸识别算法的要求是:

  1. 给定一张包含单人脸的彩色自然图像,要求计算得到图像中人脸的双眼,鼻尖和两嘴角的五个关键点坐标,并将人脸抽象成数值表达(称为「人脸模板」,也就是通常所说的人脸特征,或Feature);

  2. 对任两个人脸特征进行比较,给出相似度得分。

1:N 人脸识别和检索算法的要求是:

  1. 给定多张包含同一个人(ID)的单人脸的彩色自然图像,要求计算得到各图像中人脸的双眼,鼻尖和两嘴角的五个关键点坐标,并提取出这个人的人脸特征;

  2. 将一组特征建立为可查询的数据库;

  3. 给定一个人脸特征和K,在数据库中查询出最相似的Top-K,并给出相似度得分。

NIST官方提供了一个镜像,是一个初始的Centos 7操作系统,供应商向NIST提交的所有的算法软件包都要求在这个镜像中进行生成和测试。NIST官方还提供了算法开发框架:

https://github.com/usnistgov/frvt

算法供应商必须在此框架下进行开发算法软件,并符合其接口要求,具体要求需要仔细阅读官方文档:

https://www.nist.gov/programs-projects/frvt-1n-identification

NIST要求开发者提供的是一个或多个Linux动态链接库(*.so),以及相关数据和必要材料。开发者开发完成后,要将这些文件放入框架项目中的指定目录下,然后运行一个提供的自动化脚本完成如下流程:生成测试程序(会调用提交的算法接口)、进行简单的测试、并自动将所有需要提交的文件打成 tar 包。接下来开发者对 tar 包进行 gpg 加密和签名,就可以上传了。

上传有两种方式,一种是随邮件附件发送,如果 tar 包比较大,可以提供一个网盘链接,通过邮件把 URL 发送给 NIST。

不管是哪一项比赛,NIST 对算法的一个要求是:仅使用 CPU 计算,且单线程运行,并且整个提取特征的函数,包括检测、对齐和识别要在 1 秒内完成。这一点对于基于 CNN 模型的算法的部署方案要求很高。

经过几个月的努力,团队遇到了种种障碍和困难,甚至一度因为一个极难复现的 BUG 险些不能参赛。但最终这些问题都得到了很好的解决,这里还要是感谢 NIST 官方为我们提供了非常有效的调试信息。当然,其间波折大多涉密,这里就不方便讲了。

我们这次获得了两个单项第一,三个单项第二,综合排名第一。模型的泛化能力很好,在各个场景均表现优异。从结果榜单来看,国内的供应商占据半壁江山,实在可喜可贺。希望同行们一起继续努力,共同推动行业技术进步!

更多人工智能领域前沿资讯,请关注我们的公众号,第一时间为您送达!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值