DeepPose和IEF 都是基于回归坐标的方法。
DeepPose取关键点周围的区域作为本次回归的输入得到修正值。多阶段端到端地进行训练。
IEF是基于迭代误差反馈的人体姿态估计。迭代回归坐标的偏移量。
之后的工作主要是基于热图检测:
joint-training-of-a-convolutional-network-and-a-graphical-model-for-human-pose-estimation(泛读)
有两个分辨率的输入(多分辨率机制) ,卷积提取特征,最后得到4个channel featuremap。每一层是一个关节点的分布概率。为了处理原始输出的heatmap存在不正确的坐标定位。使用马尔可夫随机场(MRE)过滤异常结点。
这种方法,显式的添加结构先验。