姿态论文整理--02-Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields(发表于2017年4月14)

可以对多人场景的人体姿态进行识别,得到2D火柴棒。这篇论文是bottom-up(先检测肢干[keypoints or parts],再归类为不同个体)方法。其中构建肢干间联系是这篇文章的重点。


许多方法都是单人姿态估计,这篇是处理多人场景,所以不用在预处理的时候使目标居中。多人检测呢,使用top-down方法,先检测个体再检测他的身体部件,所以增加了难度,bottom-up的方法更灵活因此相应的方法会更加健壮,而且不会将不同个体身上的部件强扭到一起。

Bottom-up方法的先驱:

Pishchulin[22]提出了先标注肢体,然后再归到个人。Insafutdinov[11] (deepercut)在ResNet检测身体部件,然后根据部件组队的得分(pairwise scores)得分高低判断组合方式,他所用到的成对的公式使用线性回归结果不准确,需要额外的逻辑回归方法。

总体方法:

通过Part Affinity Fields (PAFs)计算检测到的身体各个部分间联系程度 association scores 是—-根据图片对肢体的位置和方向编码的2D矢量空间。总体流程是下面的图片。
这里写图片描述
这里写图片描述
首先,用前向网络同时预测一组肢干的位置置信图(part confidence maps) S (Fig.2-b),以及描述各部分间的关联程度的肢干映射空间(part affinity fields) L (图中的c),然后S和L组合得到所有人的keypoints,这个组合方法是这篇问题的关键。

细节:

整体结构流程:
网络结构分为两个分支,同时预测位置置信图和part-to-part association的仿射空间。且整个网络是迭代的结构,关于迭代:Wei的CPM[31]也是通过连续的stages过程来微调,然后在每个状态过程中都产生中间层intermediate supervision,用于最后的姿态计算。
这里写图片描述
所以这篇文章用到的网络结构是
先是用10层的VGG-19初始化,得到特征图Feature map。feature map作为两分支的输入的first stage,两分支的结果以及上一stage的特征图合并(ResNet结构),并且用于下一stage,像wei的cpm中的微调。相应的,在各stage有两个loss functions(这里使用的是L2 loss方法,各个stage没有sigmoid-like函数)。在loss function中还有有目标掩模,防止训练过程中惩罚到真值。
这里写图片描述
结构图
具体到各个stage
S—- part dectection,构建part和个体间的连接的基础:
得到各个身体部件的confindence map,图中的单个人时,map有一个peak;多人时,一个peak代表一个人。峰值点用来估计身体部件的准确位置。
L—-part association—-这是这篇文章的关键点
要解决的问题是—-怎么由检测到的人体部件得到完整的姿势,尤其是人数未知的时候的问题。上面提到的方法是通过confidence measure构建身体部件间的联系,通过计算所探测的每对部件间的中间点midpoint。这篇文章中提出的新方法是part affinity fields—-通过部件的既有位置得到2D仿射图:真实中的每一个肢体都有相应的仿射域来连接相连两部分(‘部分’也是神经网络检查所用训练数据和所得结果,手脚臀blala)。so,使用候选部件,candidate part,计算相应PAF线积分来探测部件。
单人情形下的方法:
这里写图片描述
多人情形:
人数变多时,所检测到的人体部件和个体的对应关系会变成一个匹配位置,行内称为NP-Hard[32],PAF是使用贪婪松弛(greedy relaxation)的方法。
该方法是先获得身体部件检测结果,然后需要将部件与人体构建联系,目标就是选择最优的连接。使用图表示,节点表示部件,边缘表示部件间的可能的联系,然后这个问题就能转成二分图的匹配,bipartite graph matching ,只不过是子问题–有一定的限制:一个节点不会连接两个边。这样这个问题就能使用匈牙利算法Hungarian algorithm解决,当然这些边的权重的初始化是按照某一公式进行(这个公司涉及到任两个身体部件的位置间的距离和这两个部件具有联系的置信度)。
然后遇到的问题和理解成为NP hard问题(有关“NP问题和relaxation”可以看此书:http://xidong.net/File001/File_62356.html 如果有兴趣的话。如果只是想glance一下,可以参考知乎https://www.zhihu.com/question/24641575/answer/164397294https://www.zhihu.com/question/26001914/answer/150369102 )。对于NP-hard问题,作者是使用relaxation方法来解决这个问题的,一是对于bipartite graph少用一些边而不是全图,二是将匹配问题分解成子匹配问题。然后相邻节点用PAF方法,全局的点关系使用CNN方法。
———这就是PAF所使用的bottom-up方法。


综合起来看,这篇文章就是想办法找到了一直构建肢体联系part connection的方法,然后使用迭代的网络来使用多尺度的的全局和局部的联系。但是使用到的PAF感觉还是模式识别的东西,但是将这个模式如果能网络学到还是蛮厉害的,毕竟身体部件间的自由度小了很多。在这篇论文,速度和精度都挺高的,可达到200FPS。
这里写图片描述

### 回答1: 实时多人二维姿态估计使用的是部件关联场技术。该技术利用深度学习网络对图像中的人体关键点进行检测和定位,并通过学习人体部位之间的关联性来提高姿态估计的准确性。在实时性方面,该技术利用高效的网络结构和并行计算技术,能够在处理多人图像时保持较高的处理速度和较低的延迟。 ### 回答2: 实时的多人2D姿态估计是指在照片或视频中同时检测多个人的姿态并实时反馈结果。这个任务主要是依赖计算机视觉领域的人体关键点检测技术。而Part Affinity Fields(PAF)是现在最常用的一种检测方法。 PAF可以理解为是人体姿态中的“骨架”,它在这里指的是需要将骨骼节点间的关系一同考虑进去来提高精度的设计。每个PAF都对应着一对关联的节点,例如手臂这一关节对应的PAF就是肩膀和手腕两个关键点中间的向量场。PAF能够将关键点之间的联系编码为一个向量场,并将它们的图像位置和方向作为通道特征,这样就可以通过深度卷积网络获得节点的连接信息。 对于多人2D姿态估计任务,PAF可以自动推断出人体的椭圆形状,使得不同人的节点互相不干扰,能够高效地分离不同人体之间的关键点信息,保证检测精度。 总体而言,实时的多人2D姿态估计技术是计算机视觉研究领域中一个非常重要的方向。通过Part Affinity Fields技术,可以实现对人体姿态的快速准确检测和分析,并具有广泛的应用前景,比如拍摄跳舞类视频、体育比赛等。未来,该领域还将会不断提高研究和开发技术,提高其在实际场景中的使用效果,为人们的生产和生活提供更多更好的便利。 ### 回答3: 在计算机视觉领域,人体姿态估计一直是一个十分重要的研究方向。现在,研究者们正在致力于开发实时多人二维姿态估计方法,本文将介绍一种方法——part affinity fields。 Part affinity fields是指身体部位之间存在的空间关系矩阵。多人姿态估计就是先将图像中的每一个像素与人体相关的身体部件联系起来,然后再利用network output将这些点连接起来形成人体姿态。part affinity fields的基本思想是采用CNN对每一个像素做预测,以定位人体骨架上的每一个连接点。 主要步骤: 1.生成部件置信图:对于输入的图像,通过CNN估计每个像素是否为其中每个身体部位的一部分,这个图叫做部件置信图(Part Confidence Maps),可以通过训练数据集来检测出身体部位的位置。 2.生成连接部件映射图:对于预测出来的部件置信图,我们可以通过预测到的部件之间的关系来学习生成连接映射图(Part Affinity Fields),即学习两个不同身体部件之间的关系(connectivity),这个关系是一个形状为“c×2×h×w”的4维张量。在测试阶段,对于输入图像中的每个像素,都会有其对应到一个连接部件映射图的位置。 3.生成姿态结果:最后,我们将生成的部件置信图和连接部件映射图进行联合,把已确定的部件通过连接映射图装配起来并组合成人体的姿态结果。 这种方法最大的好处就是实现了实时多人姿态估计,不需要预设一个特定数量的人数。同时,在处理不同人的关键点时,以前的方法通常是对每个人都单独进行估计,而这个方法则对所有人的关键点一起进行估计,能够更好地处理人际交互。 总之,通过深度学习和部件置信图与连接映射图等技术手段的利用,Part Affinity Fields在解决实时多人二维姿态估计时具有很大的潜力。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值