超阿里、大华,澎思科技行人再识别(ReID)技术刷新三大数据集记录

640?wx_fmt=jpeg


整理 | Jane

出品 | AI科技大本营(ID:rgznai100)


【导读】不久前,江苏省某市公安通过 AI 技术分析监控摄像头中的信息,抓获了一个偷盗电动车的嫌疑人员。监控摄像头在现场拍到的是嫌疑人背对摄像头的情况,未有清晰正面的人脸,但图片显示了他的穿着、发型、身高等信息,而警方运用的技术则是计算机视觉领域中的行人再识别技术(Re-ID),通过Re-ID技术警方找到了关联摄像头正好拍到他的正脸,以此确认身份,迅速将嫌疑人抓获。这也是行人再识别技术在实战场景中的一个典型应用,而提供给警方技术支持的则是国内人工智能企业澎思科技(Pensees)。


行人再识别,澎思科技 ReID算法的三大突破

 

行人再识别起源于多摄像头跟踪,指在非重叠视角域多摄像头网络下进行的行人匹配,即确认不同位置的摄像头在不同的时刻拍摄到的行人目标是否为同一人。行人再识别涉及计算机视觉、机器学习、模式识别等多个学科领域。在行人再识别(ReID)技术研究领域,首位命中率(Rank-1 Accuracy)和平均精度均值(Mean Average Precision,mAP)是衡量算法水平的核心指标。


近日,在行人再识别(Person Re-identification,简称ReID)算法上澎思科技取得了突破,在三大主流ReID数据集测试 Market1501、DukeMTMC-reID 和 CUHK03 中,算法关键指标首位命中率(Rank-1 Accuracy)刷新了世界纪录。

 

640?wx_fmt=png

 

在三大数据集上,Rank-1 指标分别达到 96.73%、92.01% 和 84.57%超过了阿里巴巴、腾讯、大华、云从科技等头部厂家;在 CUHK03 数据集的实验中,mAP 也超过了之前的成绩。


640?wx_fmt=png

澎思科技 Market1501 部分测试结果

 

澎思科技通过对算法的自研创新和融合探索,算法上的突破有以下三点:

 

1、金字塔水平分块策略:采用 human parsing 对人体分割,结合金字塔水平分块策略,使得网络准确提取细粒度区域特征的能力大幅提升;

 

如图所示, 特征图水平分割 6 等份,其幂集一共有种组合,去掉全集和空集以后还有种组合方式,这些特征区域可以组合成为新的特征图。对每个新的特征图进行常规操作(全局池化=>卷积=>批归一化=>激活函数=>全连接层=>ID 监督信号)。通过多监督信号的参与,可以大幅提高模型的精度和鲁棒性。

 

640?wx_fmt=png

 

2、(1)渐进式训练策略;(2)图网络结构

 

(1)训练阶段,借鉴 curriculum learning 思路,难样本比例逐步提升,使得损失函数更易收敛。参与训练的样本按照学习难易度、按顺序进入和退出训练循环,模型在训练的同时评估各样本的难度,如此可以保证模型能够有效挖掘样本特征完成ReID任务。

 

(2)通过图网络结构,学习得到各个细粒度特征的加权系数,进一步提高特征的分辨能力。

 

640?wx_fmt=png

 

如图所示,网络在学习行人特征提取的同时还要学习区分不同部分的人体结构,有的放矢地在这些区域提取特征并进行池化可以大大减少背景信息造成的干扰。同时使用图卷积网络对人体各部分的特征之关系经行建模可以得到一个人的整体表示,其效果要优于直接垂直等分特征图。

 

640?wx_fmt=png

 

各部分的特征向量首先堆叠在一起形成特征矩阵,使用一维卷积分别混洗每行和每列的特征,让信息在各部分、各通道之间流动,重复一定次数以后可以得到稳定的整体特征。

 

3、重构距离:最后在测试阶段,除常规距离计算手段,引入重构距离,提升网络对未对齐、遮挡等技术难点的鲁棒性。

 

640?wx_fmt=png

 

为了解决遮挡带来的精度下降问题,提出线性空间重构,利用参考图片的信息尝试尽可能地恢复残缺特征图,恢复后的特征图和参考特征图之间的距离即为重构距离。由此可以保证相似的图片之间可以互相重构,而不同个体的图片不管怎么重构都有一定的距离。从而提高了模型应对遮挡情况的能力。

ReID 算法持续优化,加速技术在多行业应用落地


ReID 算法加速技术在多行业应用落地



近年来受益于深度学习的发展,行人再识别(ReID)技术水平得到了巨大提升,超越人眼识别能力,并达到了商用的水平。作为人脸识别技术的重要补充,其发展内核便是在不同视频中,在无法获取清晰人脸特征信息前提下,机器通过穿着、发型、体态等信息将同一个人识别出来,增强数据的时空连接性。在公共安全(如智能视频监控、安保、刑侦)、智能零售、智能交通以及智慧城市等领域有很高的应用价值。

 

在公共安全领域,行人再识别技术在警务实战中可以作为人脸识别技术的有力补充,帮助公安视频侦查实现人脸、人体图像与数据联结,强化轨迹追踪功能,深化公安视频图像应用能力。

 

在智慧零售领域,行人再识别技术可以帮助商超收集“人”与“场”之间的关系数据并以可视化的方式重现。通过行人再识别技术追踪记录顾客店内行动轨迹,分析热点区域和商品关注度,分析不同区域的客流驻足率,从而据此优化商品陈列,获取最佳客流动线;感知客流峰谷,最受欢迎区域,合理配备人员,提升服务。同时,也将有助于基于用户行为画像,实现线下广告精准投放。

 

在智能制造、智慧园区等领域,行人再识别技术同样可以在提高员工工作效率,管理规范生产过程,降低企业管理成本,提升企业安保等级等方面有很多的应用场景。目前,澎思科技自研的 ReID 算法已经在不同行业的多个业务场景中落地应用。


(*本文为 AI科技大本营整理文章,转载请联系 1092722531


精彩推荐


“只讲技术,拒绝空谈”2019 AI开发者大会将于9月6日-7日在北京举行,这一届AI开发者大会有哪些亮点?一线公司的大牛们都在关注什么?AI行业的风向是什么?2019 AI开发者大会,倾听大牛分享,聚焦技术实践,和万千开发者共成长。


目前,大会盲订票限量发售中~扫码购票,领先一步!


640?wx_fmt=jpeg

640?wx_fmt=png


推荐阅读


640?wx_fmt=png 你点的每个“在看”,我都认真当成了喜欢
  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值