**提出目的**
多人姿态估计主要的挑战来自被遮挡的关键点、不可见的关键点及复杂的背景。论文设计了级联金字塔网络(CPN)用于解决这种问题。算法包含GlobalNet和RefineNet两步。基于FPN,GlobalNet用来检测简单的关键点,RefineNet使用在线关键点挖掘损失检测困难度关键点。
应用:行为识别,人机交互。
主要方法:自下而上的方法:DeepCut, DeeperCut, OpenPose;自上而下方法:G-RMI, Mask RCNN。单人姿态估计:hourglass模型。
可能影响关键点检测的因素分析:行人检测,数据预处理。
**方法描述**
1.行人检测
FPN,ROIAlign代替ROIPooling
2.网络结构
结构图
GlobalNet
浅层分辨率高,但缺少语义信息,深层语义信息丰富但分辨率低。U-shape常用来同时获得较好度分辨率和语义信息。论文使用与FPN相同度特征金字塔结构。GlobalNet定位简单度特在点如眼睛比较容易,但定位下图中的臀部点比较困难。
示意图
RefineNet
与HyperNet类似,在层间传输信息,使用上采样和串联综合不同层的信息。
**实验结果**
MS COCO test-challenge
NMS对结果的影响
行人检测对结果的影响
COCO Keypoints-challenge