爆料！传阿里人靠脸吃饭真相是......

从进出办公大楼到会议室，从取快递到食堂吃饭，只需对准摄像头刷一下脸，就能轻松完成通行、支付、取件等操作。在阿里巴巴，“脸”已经成为员工日常生活办公的通行证。

阿里园区食堂使用人脸支付

作为园区“刷脸”的主要技术支持方，阿里巴巴信息平台事业部园区大脑技术团队负责人杨含飞（花名：少昊）表示，今年1月初，第一台人脸闸机才正式在园区落地。而现在，“人脸”已经运用在阿里园区的方方面面，平均每天会进行20多万次的人脸识别。

此外，随着会议活动对安防要求的增加，一些大型展会对人脸识别的需求也变得越来越强烈。在今年9月云栖大会上，阿里内部的这套人脸闸机，支持现场12万人次的通行。

云栖大会上的人脸门禁

那么，在这些大规模的人员识别场景中，阿里内部的人脸识别究竟是如何做保障的？

今天，我们邀请少昊亲自揭秘阿里巴巴人脸识别的优化方案。

人脸识别时，首先需要对方提供一张照片进行人脸注册，然后在识别过程中，通过终端照片去检测当前画面照片上是否有人脸出现。如果有就会去提取特征并与服务端算法进行对比，来确认两者之间是否一致。可见，人脸识别实际上是特征的“提取”与“对比”。

少昊认为，在这一过程中，特征提取是否完整与充分，对比是否快速准确，与识别算法、终端软硬件以及人脸底库照片都有关系。所以，信息平台在做大型人员识别的优化时，主要从这三个方向入手：

终端的优化

终端的优化分为硬件与软件。硬件上，主要针对摄像头采用宽动态技术，IPS优化，从捕捉画面前景与背景处理上达到清晰均衡的要求，解决逆光问题，让人脸识别更加快速有效。

软件上，我们主要对拍摄清晰度做管理和控制。一般来说，在捕捉到识别图像后，首先会对每帧图像进行数据监控与评估。在经过数据化打标之后，会给图像进行分类，来考察不同清晰度下的图像通过率。以及不同清晰度与角度下，图像的实际分布情况。这能有效管控识别速度与识别距离，确保整个识别过程的通行效率。

识别算法的优化

误识率是人脸识别的基础，所以在识别算法上，技术人员一是对误识进行控制；二是对相似度进行管理。

因为受算法性能影响，随着人脸底库的增加，算法性能会逐步降低。如何在识别服务上进行优化，成为人脸识别的一大关键。

用户行为产生的大量数据，使数据预测成为可能。比如在杭州进行人脸识别出现误识别，本人有可能实际上正在北京出差或休假等。所以，如果结合数据算法模型来准确的预测用户行为，对人群进行合理区分的话，就能一定程度解决误识别。

基于此，团队成员在误识别上进行的第一个优化就是——分组优化。通过特征细分人群，降低误识，提高通过率。

分组优化首先需要考虑时间与空间因素。如果把一个区域空间圈得越小，未来一定时间内出现在该特定区域内的人也会越少。同时，时效越强，在该区域该时段出现的人脸也会越少。

同时，结合实际应用场景，通过业务规则与特点的判断，以及人脸识别算法的性能特性，就能更好确认合理的空间、时间以及人数的分组规模情况。

以阿里巴巴园区人脸识别取件的分组优化为例。从地域属性上来看，每个小邮局都是一个固定的空间单元，有具体的位置。从时效性来看，当包裹到达小邮局后，它的主人在一段时间内会去拿包裹。从业务属性上来看，小邮局是收取包裹快递的地方。通过这三点属性，就能基本确定取件场景的分组优化方案。判断哪些员工会去哪个小邮局的分组中。

此外，取件还会存在代领情况。这一情况在业务规则中就没法确认，需要基于历史行为去分析，一个包裹被别人代领的可能性是多少，以及被谁代领的可能性更高。然后将这一预判结果加入到人脸识别的分组中。