【人体姿态】Convolutional Pose Machines

本文详细介绍了Convolutional Pose Machines的工作原理和网络结构,包括多阶段监督、响应图计算等关键点。通过深度学习和卷积层,该模型在人体姿态分析中表现出色,尤其在2016年MPII竞赛中取得领先。文章还探讨了训练过程中的数据扩展、标定方法以及中继监督优化策略,以解决深层网络的优化问题。
摘要由CSDN通过智能技术生成

Wei, Shih-En, et al. “Convolutional Pose Machines.” CVPR, 2016

本论文将深度学习应用于人体姿态分析,同时用卷积图层表达纹理信息和空间信息。目前在2016年的MPII竞赛中名列前茅。作者在github提供了训练和测试源码
本文详解其思想和实践方法,并指出源码与论文中不同之处。

思想

本文的特色有三:
1.用各部件响应图来表达各部件之间的空间约束。响应图和特征图一起作为数据在网络中传递。
2.网络分为多个阶段(stage)。各个阶段都有监督训练,避免过深网络难以优化的问题。
3.使用同一个网络,同时在多个尺度处理输入的特征和响应。既能确保精度,又考虑了各个部件之间的远距离关系。
这里写图片描述

算法的流程如下:

  1. 在每一个尺度下,计算各个部件的响应图
  2. 对于每个部件,累加所有尺度的响应图,得到总响应图
  3. 在每个部件的总响应图上,找出相应最大的点,为该部件位置

重点在第一步。以下依次讲解:如何设计网络来计算响应图,以及如何训练网络。

网络结构

网络输入彩色图像(绿色ori image)。以半身模型为例,分为四个阶段(stage)。每个阶段都能输出各个部件的响应图(蓝色score),使用时以最后一个阶段的响应图输出为准。
这里写图片描述

center map(绿色)是一个提前生成的高斯函数模板,用来把响应归拢到图像中心。

评论 27
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值