小白一只,正在学习 论文RMPE: Regional Multi-Person Pose Estimation[1]
[1] Fang H, Xie S, Lu C. Rmpe: Regional multi-person pose estimation[J]. arXiv preprint, 2017.
现阶段常用的姿态识别方法,包括两步(two-step framework) 框架 和 基于部分(part-based)的框架。其中两步框架,首先检测边框(bounding boxes), 然后估计边框中的动作,这两步分别进行。缺点是姿态估计的准确率受限于 边框 定位的准确与否。
而基于部分的框架,独立检测身体的某些部分(头部,肘部等)然后将这些部分组成多个人体姿态。缺点是当有多个人靠的很近时,无法将不同人的姿态分开。
论文提出的方法,基于 两步法框架,并能在边框不准确的情况下,正确的检测人体姿态。
总体来看,论文提出了regional multi-person pose estimation (RMPE) framework 包括三个创新部分,
一个是对称空间变换网络 symmetric spatial transformer network (SSTN) 结合 SPPE Stacked Hourglass model,作用是从一个不准确的边框中提取一个高质量的单个人区域, 同时引入一个并行的SPPE分支来优化这个网络。
二是,为了消除冗余的检测,引入参数姿态非最大抑制(NMS