《Pose Flow: Efficient Online Pose Tracking》论文解读之PoseFlow

最新推荐文章于 2024-08-21 08:55:34 发布

山水之间2018

最新推荐文章于 2024-08-21 08:55:34 发布

阅读量2.1k

点赞数

分类专栏： Pose Estimation Paper Reading 文章标签： pose flow

本文链接：https://blog.csdn.net/Gavinmiaoc/article/details/89917176

版权

Paper Reading 同时被 2 个专栏收录

31 篇文章 5 订阅

订阅专栏

Pose Estimation

6 篇文章 0 订阅

订阅专栏

工作组：上交卢老师团队

发表处：BMVC

开源代码：https://github.com/YuliangXiu/PoseFlow 独立版本

GitHub实现：https://github.com/MVIG-SJTU/AlphaPose/tree/master/PoseFlow

Paper：PoseFlow

介绍

多人姿态跟踪方法，其主要方法和多人姿态检测一样，也可以分为自顶向下和自下而上。

1.自顶向下是：在每帧中检测人的proposals →关键点→相邻帧相似性跟踪整个视频；

2.自下而上是：在每帧中生成关键点候选点→时空图→求解整数线性规划将时空图分为子图→每个子图对应人体姿势轨迹。

目前，自顶向下的方法在精度(map和mota)和跟踪速度上都大大优于自下而上的方法，因为自下而上的方法由于仅仅利用二阶身体部件依赖而失去了全局姿态视图，这直接导致了对关键点的模糊分配。

由于帧退化(如快速运动造成的模糊)、截断或遮挡，单个帧中的姿态估计可能不可靠。为了解决这个问题，我们需要关联交叉帧（cross-frame）检测到的实例来共享时间信息，从而降低不确定性。

自上而下的方法首先检测人体bbox，估计关键点，跟踪box。自下而上的方法每帧检测出候选点，建立时空图，形成每个人的姿态轨迹。自上而下的方法比较有前景，但受到遮挡、截断、图片模糊等问题，如下图所示，这需要帧间共享信息。它主要利用时空信息来构建姿态流，以显著提高姿态跟踪任务。spatio-temporal information to build pose flow

方法结构

两步法，pose flow building和pose flow NMS

基本概念

1. 帧内姿态距离（Intra-Frame Pose Distance：同一帧内检测到的不同pose之间的距离，衡量同一帧两个姿态的相似度）

2.帧间姿态距离（Inter-frame Pose Distance ，使用ORB匹配计算）

1.DeepMatching->ORB

之前文中使用deepmatching方法来进行相邻帧的特征点匹配。现版本使用ORB特征算子去计算相邻帧的相似角点，ORB是OpenCV的库函数，所以就不用再各种编译DeepMatching了，最终实验结果来看，经度没有损失什么，但是速度却是原来的三倍。

2.Dataset Independent Pose Tracker

3.改进的多人姿态估计（Multi - Person Pose Estimation）

多人姿态估计这里使用 RMPE 方法， Faster R-CNN+ 改进的 SPPE

数据增强

为了处理截断问题，提出一种改进的深度提议生成器（iDPG），也就是把人体区域随机裁剪成四分之一或者一半

motion-guided box propagation

为了处理遮挡和模糊问题，提出通过交叉帧匹配技术将box proposals传播到上一帧和下一帧

首先对每一帧图像进行多人姿态估计，利用他们组自己的Alphapose基于RMPE改良版本。然后从上图中我们可以看到，有一个iDPG(improved deep proposal generator)模块。

iDPG主要是应对视频中人物的截断问题，利用随机剪裁random-crop在训练期间去生成“截断的目标人物”，特别的会利用random - crop 去吧 human instance 区域生成1/4 或1/2的截断人物（对于这里，我个人建议最好是上/左/右半身，最好不要是单纯的腿部区域，个人感觉）。也就是说，iDPG是一种训练期间的数据增广方式。

这部分也涉及到了“Motion-Guided Box Propagation”，结合前后帧之间的信息，来解决因为“运动模糊”、“遮挡”等问题导致的bbox漏检，这里主要用到的技术称之为“cross - frame matching technique”来自于“《Deepmatching: Hierarchical deformable dense matching》”

Pose Flow Building

姿态估计通过在帧间建立同一个人的关系建立，对于某个姿态，在后续帧建立候选关联姿态集，即：