方法一:自上而下(Top-down Approach : Person Detection + Pose Estimation) 给定一张图片, 先目标检测 => 对每个 bbox 做单人的姿态估计 重复此步骤并得到最终结果. 方法二:自下而上(Bottom-up Approach : Parts Detection + Parts Association) 给定一张图片, 首先检测人关键点位置