爆料!传阿里人靠脸吃饭真相是......

从进出办公大楼到会议室,从取快递到食堂吃饭,只需对准摄像头刷一下脸,就能轻松完成通行、支付、取件等操作。在阿里巴巴,“脸”已经成为员工日常生活办公的通行证。

 

阿里园区食堂使用人脸支付

 

作为园区“刷脸”的主要技术支持方,阿里巴巴信息平台事业部园区大脑技术团队负责人杨含飞(花名:少昊)表示,今年1月初,第一台人脸闸机才正式在园区落地。而现在,“人脸”已经运用在阿里园区的方方面面,平均每天会进行20多万次的人脸识别。

 

此外,随着会议活动对安防要求的增加,一些大型展会对人脸识别的需求也变得越来越强烈。在今年9月云栖大会上,阿里内部的这套人脸闸机,支持现场12万人次的通行。

 

云栖大会上的人脸门禁

 

那么,在这些大规模的人员识别场景中,阿里内部的人脸识别究竟是如何做保障的?

今天,我们邀请少昊亲自揭秘阿里巴巴人脸识别的优化方案。

 

 

人脸识别时,首先需要对方提供一张照片进行人脸注册,然后在识别过程中,通过终端照片去检测当前画面照片上是否有人脸出现。如果有就会去提取特征并与服务端算法进行对比,来确认两者之间是否一致。可见,人脸识别实际上是特征的“提取”与“对比”。

 

少昊认为,在这一过程中,特征提取是否完整与充分,对比是否快速准确,与识别算法、终端软硬件以及人脸底库照片都有关系。所以,信息平台在做大型人员识别的优化时,主要从这三个方向入手:

 

终端的优化

 

终端的优化分为硬件与软件。硬件上,主要针对摄像头采用宽动态技术,IPS优化,从捕捉画面前景与背景处理上达到清晰均衡的要求,解决逆光问题,让人脸识别更加快速有效。

 

 

 

软件上,我们主要对拍摄清晰度做管理和控制。一般来说,在捕捉到识别图像后,首先会对每帧图像进行数据监控与评估。在经过数据化打标之后,会给图像进行分类,来考察不同清晰度下的图像通过率。以及不同清晰度与角度下,图像的实际分布情况。这能有效管控识别速度与识别距离,确保整个识别过程的通行效率。

 

识别算法的优化

 

误识率是人脸识别的基础,所以在识别算法上,技术人员一是对误识进行控制;二是对相似度进行管理。

 

因为受算法性能影响,随着人脸底库的增加,算法性能会逐步降低。如何在识别服务上进行优化,成为人脸识别的一大关键。

 

用户行为产生的大量数据,使数据预测成为可能。比如在杭州进行人脸识别出现误识别,本人有可能实际上正在北京出差或休假等。所以,如果结合数据算法模型来准确的预测用户行为,对人群进行合理区分的话,就能一定程度解决误识别。

 

基于此,团队成员在误识别上进行的第一个优化就是——分组优化。通过特征细分人群,降低误识,提高通过率。

 

分组优化首先需要考虑时间与空间因素。如果把一个区域空间圈得越小,未来一定时间内出现在该特定区域内的人也会越少。同时,时效越强,在该区域该时段出现的人脸也会越少。

 

同时,结合实际应用场景,通过业务规则与特点的判断,以及人脸识别算法的性能特性,就能更好确认合理的空间、时间以及人数的分组规模情况。

 

以阿里巴巴园区人脸识别取件的分组优化为例。从地域属性上来看,每个小邮局都是一个固定的空间单元,有具体的位置。从时效性来看,当包裹到达小邮局后,它的主人在一段时间内会去拿包裹。从业务属性上来看,小邮局是收取包裹快递的地方。通过这三点属性,就能基本确定取件场景的分组优化方案。判断哪些员工会去哪个小邮局的分组中。

 

此外,取件还会存在代领情况。这一情况在业务规则中就没法确认,需要基于历史行为去分析,一个包裹被别人代领的可能性是多少,以及被谁代领的可能性更高。然后将这一预判结果加入到人脸识别的分组中。

 

阿里园区小邮局通过人脸取件

 

通过一系列的算法模型学习优化,提升模型预测的准确性,不断的改善人员分组质量,目前人脸在支持阿里巴巴园区通行上,误识率已经有效控制在千分之一左右。

 

除了分组优化外,在面对不同肤色与人种的情况下,团队还建立了不同种类的算法模型与底库。这样可以针对特定肤色人种的通行率和误识率,做针对性的优化。

 

人员底库照片的优化

 

少昊表示,很多时候,人脸识别不成功并不是现场摄像头或比对算法出了问题,还是底库照片的质量太差,导致无法进行人脸识别。除了让对方重新提供照片图像外,还可以通过算法进行大小脸检测、照片校正以及身份核实,来确认本人身份。

 

此外,算法还可以帮助底库照片进行自学习。通过人员照片序列的分析后,提取特征进行图片聚类分析,随后再通过图片质量分析后,对本人身份进行核实,进而完成底库照片的注册与特征提取。

 

通过上述手段优化,在人脸识别通过率保持不变的情况下,误识率可以降到1‰。

 

今年双11期间,阿里园区的这套人脸识别技术还应用于双11作战指挥室与天猫双11晚会现场的安防保障。

 

少昊表示,通过人脸属性识别的进一步丰富,硬件及算法能力的进一步提升,未来,人脸识别技术将会满足更多商业场景需求,一个真正的刷脸时代就要来了。

智慧旅游解决方案利用云计算、物联网和移动互联网技术,通过便携终端设备,实现对旅游资源、经济、活动和旅游者信息的智能感知和发布。这种技术的应用旨在提升游客在旅游各个环节的体验,使他们能够轻松获取信息、规划行程、预订票务和安排食宿。智慧旅游平台为旅游管理部门、企业和游客提供服务,包括政策发布、行政管理、景区安全、游客流量统计分析、投诉反馈等。此外,平台还提供广告促销、库存信息、景点介绍、电子门票、社交互动等功能。 智慧旅游的建设规划得到了国家政策的支持,如《国家中长期科技发展规划纲要》和国务院的《关于加快发展旅游业的意见》,这些政策强调了旅游信息服务平台的建设和信息化服务的重要性。随着技术的成熟和政策环境的优化,智慧旅游的时机已经到来。 智慧旅游平台采用SaaS、PaaS和IaaS等云服务模式,提供简化的软件开发、测试和部署环境,实现资源的按需配置和快速部署。这些服务模式支持旅游企业、消费者和管理部门开发高性能、高可扩展的应用服务。平台还整合了旅游信息资源,提供了丰富的旅游产品创意平台和统一的旅游综合信息库。 智慧旅游融合应用面向游客和景区景点主管机构,提供无线城市门户、智能导游、智能门票及优惠券、景区综合安防、车辆及停车场管理等服务。这些应用通过物联网和云计算技术,实现了旅游服务的智能化、个性化和协同化,提高了旅游服务的自由度和信息共享的动态性。 智慧旅游的发展标志着旅游信息化建设的智能化和应用多样化趋势,多种技术和应用交叉渗透至旅游行业的各个方面,预示着全面的智慧旅游时代已经到来。智慧旅游不仅提升了游客的旅游体验,也为旅游管理和服务提供了高效的技术支持。
智慧旅游解决方案利用云计算、物联网和移动互联网技术,通过便携终端设备,实现对旅游资源、经济、活动和旅游者信息的智能感知和发布。这种技术的应用旨在提升游客在旅游各个环节的体验,使他们能够轻松获取信息、规划行程、预订票务和安排食宿。智慧旅游平台为旅游管理部门、企业和游客提供服务,包括政策发布、行政管理、景区安全、游客流量统计分析、投诉反馈等。此外,平台还提供广告促销、库存信息、景点介绍、电子门票、社交互动等功能。 智慧旅游的建设规划得到了国家政策的支持,如《国家中长期科技发展规划纲要》和国务院的《关于加快发展旅游业的意见》,这些政策强调了旅游信息服务平台的建设和信息化服务的重要性。随着技术的成熟和政策环境的优化,智慧旅游的时机已经到来。 智慧旅游平台采用SaaS、PaaS和IaaS等云服务模式,提供简化的软件开发、测试和部署环境,实现资源的按需配置和快速部署。这些服务模式支持旅游企业、消费者和管理部门开发高性能、高可扩展的应用服务。平台还整合了旅游信息资源,提供了丰富的旅游产品创意平台和统一的旅游综合信息库。 智慧旅游融合应用面向游客和景区景点主管机构,提供无线城市门户、智能导游、智能门票及优惠券、景区综合安防、车辆及停车场管理等服务。这些应用通过物联网和云计算技术,实现了旅游服务的智能化、个性化和协同化,提高了旅游服务的自由度和信息共享的动态性。 智慧旅游的发展标志着旅游信息化建设的智能化和应用多样化趋势,多种技术和应用交叉渗透至旅游行业的各个方面,预示着全面的智慧旅游时代已经到来。智慧旅游不仅提升了游客的旅游体验,也为旅游管理和服务提供了高效的技术支持。
深度学习是机器学习的一个子领域,它基于人工神经网络的研究,特别是利用多层次的神经网络来进行学习和模式识别。深度学习模型能够学习数据的高层次特征,这些特征对于图像和语音识别、自然语言处理、医学图像分析等应用至关重要。以下是深度学习的一些关键概念和组成部分: 1. **神经网络(Neural Networks)**:深度学习的基础是人工神经网络,它是由多个层组成的网络结构,包括输入层、隐藏层和输出层。每个层由多个神经元组成,神经元之间通过权重连接。 2. **前馈神经网络(Feedforward Neural Networks)**:这是最常见的神经网络类型,信息从输入层流向隐藏层,最终到达输出层。 3. **卷积神经网络(Convolutional Neural Networks, CNNs)**:这种网络特别适合处理具有网格结构的数据,如图像。它们使用卷积层来提取图像的特征。 4. **循环神经网络(Recurrent Neural Networks, RNNs)**:这种网络能够处理序列数据,如时间序列或自然语言,因为它们具有记忆功能,能够捕捉数据中的时间依赖性。 5. **长短期记忆网络(Long Short-Term Memory, LSTM)**:LSTM 是一种特殊的 RNN,它能够学习长期依赖关系,非常适合复杂的序列预测任务。 6. **生成对抗网络(Generative Adversarial Networks, GANs)**:由两个网络组成,一个生成器和一个判别器,它们相互竞争,生成器生成数据,判别器评估数据的真实性。 7. **深度学习框架**:如 TensorFlow、Keras、PyTorch 等,这些框架提供了构建、训练和部署深度学习模型的工具和库。 8. **激活函数(Activation Functions)**:如 ReLU、Sigmoid、Tanh 等,它们在神经网络中用于添加非线性,使得网络能够学习复杂的函数。 9. **损失函数(Loss Functions)**:用于评估模型的预测与真实值之间的差异,常见的损失函数包括均方误差(MSE)、交叉熵(Cross-Entropy)等。 10. **优化算法(Optimization Algorithms)**:如梯度下降(Gradient Descent)、随机梯度下降(SGD)、Adam 等,用于更新网络权重,以最小化损失函数。 11. **正则化(Regularization)**:技术如 Dropout、L1/L2 正则化等,用于防止模型过拟合。 12. **迁移学习(Transfer Learning)**:利用在一个任务上训练好的模型来提高另一个相关任务的性能。 深度学习在许多领域都取得了显著的成就,但它也面临着一些挑战,如对大量数据的依赖、模型的解释性差、计算资源消耗大等。研究人员正在不断探索新的方法来解决这些问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值