论文来源
题目: Convolutional Pose Machines - CVPR2016
作者: Shih-En Wei, Varun Ramakrishna, Takeo Kanade, Yaser Sheikh
团队: The Robotics Institute Carnegie Mellon University
简介
CPM是目前比较有名的一个人体姿态估计模型,给定一张图片,可以得到人体的关节点,对body的估计有14个关节点,对手的估计有21个关节点。我们将利用这个模型得到给定图片body的14个关节点信息,并提取出来作为SMPL模型的输入,以产生后续的三维模型。
基本思想
Pose Machines为学习丰富的隐式空间模型提供了一个序列预测框架。Convolutional Pose Machines则将Convolutional Network整合进Pose Machines,提供了一种学习用于姿态估计任务的图像特征和图像相关的空间模型。CPMs是由全卷积网络组成的序列化结构,卷积网络直接在前一阶段的置信图(belief maps)操作,输出越来越精细化的关节点位置估计结果,它对 long-range 范围内变量间的关系进行建模,以处理结构化预测任务。
算法流程与网络结构
该结构是通过设计一个卷积网络组成的序列结构来实现的,该结构之前操作前一阶段的置信图,不断修正,产生预测估计。作者提出的方法提供了一个自然学习目标函数来加强中间监督&#x