OpenPose学习笔记

最新推荐文章于 2024-08-19 12:15:10 发布

MOLWH

最新推荐文章于 2024-08-19 12:15:10 发布

阅读量3.3w

点赞数 26

分类专栏： CV Pose Estimation 文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_38369492/article/details/104482481

版权

CV 同时被 2 个专栏收录

8 篇文章 3 订阅

订阅专栏

Pose Estimation

1 篇文章 0 订阅

订阅专栏

2.3.1. CMP(confidence maps for part):

2.3.2. PAF(part affinity fields):

2.3.3. 使用PAFs进行多人解析：

3. Openpose环境搭建及demo测试

3.1. 遇到的问题：

3.2. demo测试结果：

4. OpenPose输出定义

1.摘要

本文重点解读openpose开源项目的论文之一openpose:Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields，并搭建openpose环境，测试openpose demo。

2.论文解读

论文讲述了多人图像中2D姿态检测方法PAF（Part Affinity Fields），即部分亲和力字段。采用bottom-up的方式，先检测出各个关节点，再将它们与个体联系起来，实现了对多人的实时检测。

2.1. 多人的2D姿态估计难点：

（1）人数规模及人的位置不确定；

（2）人与人之间存在干扰，使关节关联变得困难；

（3）人数越多复杂度越高，实时性能越差。

Top-down方式先检测出单人，再做姿态估计，这种方式实时性差，且姿态估计的准确性依赖于人员检测器。而bottom-up方式在最终解析时成本高，难度大。文中提到的PAF是一组对位置和图像上肢体方向进行编码的2D矢量场。

2.2. 算法原理：

输入原始图，由VGG-19的前10层初始化并进行微调，生成一组特征映射F作为第一阶段的输入。在此阶段，网络产生一组PAFs，即像素点在骨架中的走向（肢体），上图中蓝色部分，，其中为第1阶段推理的CNNs。在随后的每一阶段，将前一阶段的预测与原始图像特征F串联起来，用于产生精细的预测，迭代次后进行置信度S：关键点（人体关节）的循环，上图橙色部分。

此图是在论文（CVPR, 2017）的基础上的更新（IEEE,2019）（目前网上介绍的都是以前的结构），将每个7x7卷积核替换为3个连续的3x3卷积核，在减少计算量的同时保留了接收域。前者的操作数为2 x -1=97，而后者仅为51。该网络的非线性层数增加了两倍，既能保持较低的层次特征，又能保持较高的层次特征。2017paper在每个阶段都对PAF和置信度图分支进行了细化。但是PAF提高了置信度图的结果，反之不成立。即查看PAF通道输出，就可以猜测出身体部位的位置，但是通过一堆没有其他信息的身体部位把它们解析成不同的人。因此，现在每个阶段的计算量减少了一半。