论文阅读理解 - Convolutional Pose Machines

论文阅读理解 - Convolutional Pose Machines

[Paper - CVPR2016]

[Code - Caffe]

[Code - TensorFlow 1.0+]

基于序列化的全卷积网络结构,学习空间信息和纹理信息,估计人体姿态.

摘要:

Pose Machines 是一种序列化的预测框架,可以学习信息丰富的空间信息模型.

Convolutional Pose Machines(CPMs) 是将 Convolutional Network 整合进 Pose Machines,以学习图像特征和图像相关(image-depenent)的空间模型,估计人体姿态.

CPMs 对 long-range 范围内变量间的关系进行建模,以处理结构化预测任务,如,人体姿态估计.

  • CPMs 是由全卷积网络组成的序列化结构,卷积网络直接在前一阶段的置信图(belief maps)操作,输出越来越精细化的关节点位置估计结果;
  • CPMs 能够同时学习图像和空间信息的特征表示;且,不需要构建任何显式的关节点间关系模型;
  • 中间监督 loss 解决梯度消失(vanishing gradients)问题.
  • end-to-end with backpropagation.

CPMs 由全卷积网络序列化组成,并重复输出每个关节点的 2D 置信图. 每一个stage,采用图像特征和上一 stage 输出的2D置信图作为输入.

置信图为后面的阶段提供了每个关节点位置的空间不确定性(spatial uncertainty)的非参数编码,使得 CPM 可以学习到丰富的与图像相关的关节点间关系的空间模型.

以 CPM 的某个特定 stage 为例: 关节点置信图的空间信息,为后续 stage 提供了很无歧义的线索信息. 因此,CPM 的每个 stage 都可以输出越来越精细的关节点置信图,如 Figure 1.

这里写图片描述

为了捕捉关节点间 long-range 的相互关系,CPMs 中每个 stage 的网络设计的启发点是:同时在图像和置信图上得到大的接受野(large receptive field).

1. Pose Machines

YpZ Y p ∈ Z 表示关节点 p p 的像素位置, Z 是图片内所有的关节点位置 (u,v) ( u , v ) 集合.

人体姿态估计的目标:预测图片中 P P 个人体关节点位置 Y = ( Y 1 , . . . , Y P ) .

Pose Machine 由 multi-clas 预测器序列组成,如下图, gt() g t ( ⋅ ) 是待训练模型,分类器,用于预测每一 level 中各人体关节点位置.

这里写图片描述

在每个 stage t{ 1,...,T} t ∈ { 1 , . . . , T } ,分类器 gt g t 输出每个关节点位置的置信 Yp=z,zZ Y p = z , z ∈ Z . 分类器 gt g t 是基于在图像位置 z z 所提取的特征为 x z R d ,以及先前 stage 分类器输出的 Yp Y p 邻域的空间内容信息,进行分类的.

stage t=1 t = 1 时,分类器

  • 9
    点赞
  • 46
    收藏
    觉得还不错? 一键收藏
  • 23
    评论
评论 23
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值