Cascaded Pyramid Network for Multi-Person Pose Estimation
CVPR 2018
read time : 2019/09/16
paper address : https://arxiv.org/pdf/1711.07319.pdf
论文中,作者提出了新颖的网络结构:Cascaded Pyramid Network(CPN)。 试图解决人体姿态中的"hard" keypoints。算法包括两个阶段:GlobalNet 和 RefineNet。
GlobalNet 是特征金字塔网络,可以成功定位简单的关键点(眼睛,手),但是不能精确地识别遮挡和不可见的点。
RefineNet 用来处理"hard" keypoints。通过整合GlobalNet所有层的特征表示。使用可 难例挖掘策略OHEM(online hard keypoint mining) loss。第二阶段中继续对第一阶段的feature map进行卷积进一步的获得更高层的语义信息。
论文采用 top-down pipeline。首先使用Human Detector 产生一系列的bounding boxs。然后使用CPN对每一个bounding box进行使用CPN进行关键点定位。