【人体姿态】Convolutional Pose Machines

最新推荐文章于 2022-06-02 11:32:01 发布

shenxiaolu1984

最新推荐文章于 2022-06-02 11:32:01 发布

阅读量4.7w

点赞数 33

分类专栏：论文解读文章标签：深度学习人体姿态图像 deep-learn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shenxiaolu1984/article/details/51094959

版权

本文详细介绍了Convolutional Pose Machines的工作原理和网络结构，包括多阶段监督、响应图计算等关键点。通过深度学习和卷积层，该模型在人体姿态分析中表现出色，尤其在2016年MPII竞赛中取得领先。文章还探讨了训练过程中的数据扩展、标定方法以及中继监督优化策略，以解决深层网络的优化问题。

摘要由CSDN通过智能技术生成

Wei, Shih-En, et al. “Convolutional Pose Machines.” CVPR, 2016

本论文将深度学习应用于人体姿态分析，同时用卷积图层表达纹理信息和空间信息。目前在2016年的MPII竞赛中名列前茅。作者在github提供了训练和测试源码。
本文详解其思想和实践方法，并指出源码与论文中不同之处。

思想

本文的特色有三：
1.用各部件响应图来表达各部件之间的空间约束。响应图和特征图一起作为数据在网络中传递。
2.网络分为多个阶段（stage）。各个阶段都有监督训练，避免过深网络难以优化的问题。
3.使用同一个网络，同时在多个尺度处理输入的特征和响应。既能确保精度，又考虑了各个部件之间的远距离关系。
这里写图片描述

算法的流程如下：

在每一个尺度下，计算各个部件的响应图
对于每个部件，累加所有尺度的响应图，得到总响应图
在每个部件的总响应图上，找出相应最大的点，为该部件位置

重点在第一步。以下依次讲解：如何设计网络来计算响应图，以及如何训练网络。

网络结构

网络输入彩色图像（绿色ori image）。以半身模型为例，分为四个阶段（stage）。每个阶段都能输出各个部件的响应图（蓝色score），使用时以最后一个阶段的响应图输出为准。
这里写图片描述

center map（绿色）是一个提前生成的高斯函数模板，用来把响应归拢到图像中心。

最低0.47元/天解锁文章

关注

33
点赞
踩
158

收藏

觉得还不错? 一键收藏
27
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 27

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。