PAF 速度和效果 都好 《Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields》CVPR 2017

概述

本文承接CMP论文的框架结构,最大的创新点在于提出了一种PAF的方法,能够有效的针对多人进行姿态估计,同时在保证精度的情况下,可以做到实时的效果。

传统的方法采用top-down的方法,即先检测人,然后对每一个人进行姿态估计,但是当人离得比较近的时候,检测人体的方法无效;并且人数越多,检测所花的时间约多,不能做到实时效果。因此本文采用bottom-up的方式,但是也利用了全局上下文信息。

PAF

文章提出的Part Affinity Fields(PAFs)是一个2D向量集合,每一个2D向 
量集合都会编码一个limb的位置和方向。这些fields和关节的置信图一起经过CNN进行联合学习和预测.

方法

1,使用置信图进行关节检测

每一个关节对应一个置信图,图像每一个像素点都有一个置信度,置信图中每点的值与ground truth的距离相关。关于多个人的检测,是将K个人的置信图合并取该点每个人的最大值。这里使用最大而不是平均是因为即使峰值很近也不会影响精度。测试阶段使用非极大值抑制来获得身体部分的候选。

2,使用PAF进行身体部分组合 
对于多个人的问题,检测了不同人的部分,但是还需要将每个人的身体分别组合在一起形成full-body,使用的方法就是论文的精华PAF。这个方法的好处在于将位置和方向信息都包含了。每一种limb(肢)在关联的两个body part之间都有一个亲和区域,其中的每一个像素都有一个2D 向量的描述方向。亲和 
区map的维度是w*h*2 (因为向量是二维的)。若某个点有多人重叠,则将k个人的vector求和,再除以人数。

3,bottom-up方法 
在得到了置信图和PAF之后,需要考虑如何利用这些信息找到两两body-part最优化的连接方式,这转换为图论问题。论文使用的是Hungarian algorithm。图中的节点就是body part中的检测候选,边就是这些候选最优的连接方式。每条边上的权值就是亲和区的聚合。因此这样的匹配问题就是找到一组连接使 
得没有两条边是共享一个节点的,也就是找到权值最大的边连接方式。

网络框架

网络分为两路结构,一路是上面的卷积层,用来获得置信图;一路是下面的卷积层,用来获得PAFs。网络分为多个stage,每一个stage结束的时候都有中继监督。每一个stage结束之后,S以及L都和stage1中的F合并。上下两路的loss都是计算预测和理想值之间的L2 loss。 
这里写图片描述

Loss方程中有一个空间上的加权,是因为有些数据集没有完全标注所有的人,用其提供的mask说明有些区域是可能包含没有标记的人。最终的loss是各个阶段的loss相加。

论文在MPII和COCO数据集上都取得了非常好的效果,制作的demo效果也非常好,只是对尺度比较小的人检测效果不如其他算法。

开源实现

https://github.com/ZheC/Realtime_Multi-Person_Pose_Estimation 
demo效果很好,有基于各个深度学习框架的版本实现,caffe,MXnet,tensorflow,pyTorch,也是openpose项目的核心来源。目前开源实现中最好的效果。demo的效果可以达到15-16FPS

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Part Affinity Fields(PAF)是一种用于人体姿势估计的神经网络技术,它可以检测出人体各个关节之间的连接关系和方向,从而实现对人体姿势的准确识别和跟踪。PAF技术在计算机视觉、机器人、虚拟现实等领域具有广泛的应用前景。 ### 回答2: Part Affinity Fields (PAF)是一种用于姿态估计的技术,可以检测人体的关键点,并将它们连接在一起。它由Zhe Cao等人在2017年的Essential part-based pose estimation paper中提出。 在PAF中,探测器主要分为两部分:一个关节探测器和一个部分相关场(PAF)探测器。关节探测器检测每个人体关键点的位置,并生成一个heatmap。在PAF探测器中,我们检测人体关键点之间的连接,并生成一组PAF heatmap,代表连接的概率。这意味着我们可以将两个关键点之间的概率用向量场的形式表示出来。 在训练过程中,PAF使用带有关键点注释的大量图像进行训练。在测试时,PAF通过这些向量场在两个关键点之间进行插值来确定连接。 PAF有助于提高关键点检测精度。因为它可以解决某些关键点重叠或部分遮挡的问题。此外,PAF还涵盖了肢体姿态与关键点之间的相关性,有助于更准确地表示姿态。 在实践中,PAF已经被用于人体动作识别,人体跟踪和人体姿态估计等应用中。 ### 回答3: Part Affinity Fields(PAFs)又被称作部分关联场,在计算机视觉和深度学习领域的人体姿态估计问题中起着至关重要的作用。 PAFs是一种基于卷积神经网络的算法,旨在对图像中的人体姿态关节建模。其主要的思想是将身体部位之间的关联关系建模出来,从而更准确地估计每个部位的位置。这种方法通过在卷积神经网络中建立结构化的特征图来进行,其中每个像素都代表身体上某个关键部位(比如鼻子、肘部、膝盖等)。在这些像素之间,PAFs可以计算出表示不同身体部位之间联系的向量场,通过这些向量场的核心特征来检测身体部位的变化情况以及它们之间的联结。这样就可以形成一个全局的人体关键点分布,以帮助机器更好地分析和理解人体姿态。 与传统的人体姿态估计算法相比,PAFs的优势在于它可以在具有更高的准确性和速度的同时,通过自动化的人体关节检测、跟踪及姿态估计来帮助计算机更好地理解人体动作。这使得PAFs成为了许多实际应用中的主要算法之一,例如人体动作跟踪、动作识别、游戏、虚拟现实等等。 综上所述,PAFs是一种重要的人体姿态估计算法,它通过卷积神经网络中的结构化特征图来建模身体部位之间的相互联系,以达到更准确和快速的人体姿态估计效果。它在许多实际应用中都具有广泛的应用前景。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值