（基于部分亲和域的实时多人二维姿态估计论文摘要部分）Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

最新推荐文章于 2022-09-03 11:15:21 发布

位沁

最新推荐文章于 2022-09-03 11:15:21 发布

阅读量444

点赞数 1

分类专栏：深度学习文章标签：机器学习深度学习

本文链接：https://blog.csdn.net/qq_43543515/article/details/106636573

版权

深度学习专栏收录该内容

27 篇文章 2 订阅

订阅专栏

1、摘要

我们提出了一种有效检测图像中多个人的二维姿态的方法。这种方法使用了一种非参数表示法，我们称之为部分亲合域(pafs) ，来学习将图像中每个人的身体部位联系起来。在这里插入图片描述（提到这个ＰＡＦ先介绍一下提出该方法的思路：图（ａ）是已知关键点红色和蓝色之后，所有可能的连线结果。图（ｂ）是一种通过额外检测出一个红蓝关键点之间的中间点（黄色）来确定他们之间的联系，但是在人位置过于集中时很容易产生错误的联系。因此本文提出（ｃ）方法，在红蓝关键点之间预测一种新颖的特征表示，称作part affinity field（ＰＡＦ），用２Ｄ向量同时可以表示肢干所在位置及方向。）*[这部分可参考这位作者](https://zhuanlan.zhihu.com/p/79594205?from_voters_page=true
然后如下图，其中ｊ表示关键点，ｋ表示图中第ｋ个人，Ｘ表示关键点的位置。
在这里插入图片描述
以上公式可以理解为，对于点Ｐ，如果Ｐ在第ｋ个人的肢体ｃ上，那么在Ｐ点处置为向量Ｖ，否则为０。其中v = (xj2,k − xj1,k)/||xj2,k −xj1,k||2，即两个关键点之间的单位向量（||xj2,k −xj1,k||2为范数也就是模，这样就是单位向量）。
根据如下公式判断Ｐ点在不在肢体ｃ上：
[公式] 表示两个关键点之间的长度：lc,k = ||xj2,k − xj1,k||2， [公式] 表示肢体的宽度（不知道这个值怎么得到的，论文里没有提）。
lc,k表示两个关键点之间的长度：lc,k = ||xj2,k − xj1,k||2，在这里插入图片描述表示肢体的宽度（不知道这个值怎么得到的，论文里没有提）。根据上面的图形就很好理解这个公式。
多人的肢体重合的情况有公式
nc§ 表示在位置Ｐ处不为零的ｖｅｃｔｏｒ的个数。ｋ为在Ｐ位置重叠的人的个数。
测试时只得到了很多肢体向量，那么如何衡量两个关键点之间的关联程度？这里用到了线积分,对于两个候选部位位置dj1和dj2，我们从PAFs中取样，Lc表示的是沿着线段去衡量它们间联系的置信度：在这里插入图片描述
其中p(u)是在两个身体部位dj1和dj2间插入的位置,实际上，我们通过抽样和求和等间距的u的值来近似积分。
）
该体系结构对全局上下文进行编码，允许贪婪的自下而上的解析步骤，在实现实时性能的同时保持高精度，而不考虑图像中的人数。该体系结构旨在通过同一序列预测过程的两个分支联合学习零件位置及其关联。我们的方法在首届COCO 2016关键点挑战赛中排名第一，在性能和效率方面都大大超过了之前MPII多人测试的最新结果。
（自下而上和自上而下：先说说自下而上研究的优势。自下而上的研究看起来更像是白盒研究，通过模拟来了解智能真正的机制。而自上而下的研究像是黑盒研究，更多的需要去猜测或者尝试来达到同样的功能。如果能够猜出结构当然最好，但如果黑盒非常复杂，猜出结构是很难的。模仿其复杂行为也是很困难的。但同时，自上而下的研究也非常具有指导意义，其了解了人脑不同区域是有分工的，输入输出的处理使用了大部分大脑。自上而下的研究也积累了很多经验，可以用来验证强人工智能的能力。详见）