论文笔记一（1）：OpenPose（Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields部分

最新推荐文章于 2020-10-13 19:10:13 发布

位沁

最新推荐文章于 2020-10-13 19:10:13 发布

阅读量249

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/qq_43543515/article/details/106640157

版权

深度学习专栏收录该内容

27 篇文章 2 订阅

订阅专栏

补：
在这里插入图片描述
由图上多人体姿态检测，属于同一个人的身体的部分被链接；左下角：部分亲和域对应于胳膊连接肘部和右手腕，颜色编码方向。右下角：一个放大了的部分亲和域的图像，视野中的每个像素点处一个二维矢量对四肢的位置和方向进行编码。

1、
人体二维姿态估计，十关于定位解剖学关键点或部位的问题，主要集中于寻找每个人的身体部位。在一张图像中推断多人姿势，特别是参加社会活动的人，提出了一些挑战，首先每张图片可能包含未知数量的人，而这些位置或者规模能是任意的，第二人与人之间的相互作用诱发复杂的空间干扰，由于接触，遮挡，和肢体关节，使部分联系困难。第三，随着图片中人数的增加，运行的复杂性也在增加，这使得实时性能成为一个挑战。
一个普遍的方法是使用人体检测并每次进行单人估计。这些自上而下的检测方法利用已有的单人估计技术，但是由于**早期承若（直译，不造啥意思）**的原因，如果人员检测失败------即当人们靠得很近的时候就容易失败且无法恢复，这种自顶向下的方法消耗的时间也随人数的增加而增加。每次检测都运行一个单人姿态估计器，人员越多计算成本越大。相反自底向上的方法更有吸引力，因为他们提供了对早期承诺的健壮性，并且有潜力将运行时的复杂性与人数关系分离开。然而自底向上方法并不直接用其它人或者其他肢体部分的上下文信息。实践中发现自底向上的方法并不能保持效率的提高，因为最后的解析所耗的全局推理十分巨大。例如，Pishchulin等人的开创性工作[22]提出了一种自底向上的方法，该方法联合标记部分检测候选对象并将其与个人关联。然而，在全连通图上求解整数线性规划问题是一个np困难的问题，平均处理时间约为小时。Insafutdinov等人在[22]的基础上构建了更强大的基于ResNet[10]和图像相关的成对分数的部分检测器，并极大地改进了运行时间，但该方法仍然需要几分钟的图像，并限制了部分建议的数量.中使用的成对表示很难精确地回归，因此需要单独的逻辑回归。
在这里插入图片描述
图2。整体的流程。我们的方法将整个图像作为输入的两个分支CNN联合预测置信地图部位检测,(b)所示,部分协会和部分关联字段,©所示。解析步骤执行一组关联配合双方的身体部分候选(d)。我们终于将它们组装成完整的身体姿势对图像中所有人(e)。
在这篇文章中，我们提出了一种基于多个公共基准上最精确的多姿态估计有效的方法。我们提出了第一个自底向上表示的关联分数通过Part Affinity Fields (PAFs)，一组二维向量场编码的位置和方向的四肢在图像域。我们证明了同时推断这些自底向上的检测和关联表示可以很好地编码全局上下文，从而允许贪婪解析以一小部分计算成本获得高质量的结果。我们已经公开发布了代码的充分再现，提出了第一个实时系统的多个人2D位姿检测。