多人姿态估计新兴研究方向,论文方法RMPE包含三个部分,即,对称空间变换网络(SSTN)、参数化的姿态非极大值抑制及姿态引导的proposal生成器(PGPG)。
多人姿态识别的方法有两步结构、part-based的结构两种。其中两步结构首先检测人体bbox,之后在每个box内独立估计姿态。part-based结构首先检测人体部件,然后组装检测到的人体部件形成多人姿态。
论文的方法是两步法,目标是在bbox不准确的情况下准确检测人体姿态。之前的方法Faster-RCNN结合SPPE Stacked Hourglass模型主要问题:定位错误问题、多检问题。SPPE易受bbox误差的影响,如下图所示:
SSTN是为了从不准确的bbox中提取高质量的人体区域,同时一个平行的SPPE分支用于优化网络,参数化的NMS为了解决冗余检测问题,PGPG用于增强样本。
RMPE的框架如下图所示: