【论文解读】Stacked Hourglass Networks

最新推荐文章于 2024-07-27 10:18:39 发布

智能血压计

最新推荐文章于 2024-07-27 10:18:39 发布

阅读量664

点赞数 7

分类专栏：图像识别图像分割文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lz867422770/article/details/109516806

版权

图像识别同时被 2 个专栏收录

15 篇文章 1 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

题目：Stacked Hourglass Networks forHuman Pose Estimation

作者背景：

ECCV 2016录用

作者来自密歇根大学

一、中心思想

- 提出一种新的卷积网络结构，称为堆叠式沙漏网络，用于人体姿态估计

- 融合各个尺度提取特征，重复自顶向下、自底向上的架构

- 几个关键技术：残差模块、Hourglass Module、中间监督

二、模型结构

对于模型的架构，我们逐级拆解来理解：

- 从最小的单元残差模块开始理解

- 残差模块组合成为Hourglass Module

- Hourglass Module堆叠起来，前后增加一些简单的层，即构成了网络整体架构

接下来进行详细解释

2.1 残差模块：

preview preview

残差块结构如图所示，详细的数据过程是下面的图片：

- 主体路径是是3个卷积层，卷积核分别为：1*1、3*3和1*1；

- skip路径是一个卷积核为1*1的卷积层

preview

2.2 Hourglass Module

Hourglass Module由上面的Residual Module组成，由于它是一个递归的结构，所以可以定义一个阶数来表示递归的层数，首先来看一下一阶的Hourglass Module

preview

上图中的Max pool代表下采样，Res代表上面介绍的Residual Module，Up Sample代表上采样，这里使用的上采样方法是最近邻差值

多阶的Hourglass Module就是将上图虚线框中的块递归地替换为一阶Hourglass Module，由于作者在实验中使用的是4阶的Hourglass Moudle，所以我们画出了4阶的Hourglass Module的示意图：

preview
对应的原文中的一个HourglassMoudle的架构如Fig3所示，其中每个box都代表一个残差模块

preview

2.4 整体架构

先看一下整体架构的概况，如下图所示

preview

- 网络输入的图片分辨率为256×256，然后经过一个7*7，步长为2的卷积层，之后再经过一个残差块和Maxpooling层使得分辨率降低到64，这一步骤的目的主要是降低显存

- 然后将尺寸为64*64的特征图输入到8个堆叠起来的（4阶Hourglass Module+Res+conv+relu+conv）中，特征输出尺寸保持不变

- 最后一个Hourglass Module的输出不再进行合并，直接输出heatmap

数据流图如下所示

preview

上面的整体网络架构图中，红色的模块为中间监督的过程，输出为16通道，针对MPII数据集，因为该数据集有16个关节点，因此输出为16通道

下面，具体介绍一下网络的中间监督过程

2.5 中间监督

- 作者在整个架构中堆叠了8个hourglass模块，提到其关键是要使用中间监督来对每一个hourglass模块进行预测，即计算每个hourglass模块输出的heatmap的损失

- 中间监督的位置图下图中蓝色部分所示，选取该位置的原因是：监督的特征，需要同时包含高级别和低级别、全局和局部特征，因此选在每个hourglass模块的输出位置

preview

作者对每个hourglass的输出的heatmap计算loss，每个loss给予不同的权重，并加和成为模型学习的总loss，进行反向传播学

三、其他

3.1 损失函数

损失函数采用Mean Squared Error（MSE）来比较预测的heatmap与ground-truth的heatmap（在关键点中心周围使用标准差为1的2D高斯分布）

参考文献：

【1】Newell A , Yang K , Deng J . Stacked Hourglass Networks for Human Pose Estimation[J]. arXiv e-prints, 2016.

【2】https://cloud.videojj.com/bbs/topic/40/%E8%AE%BA%E6%96%87%E7%AC%94%E8%AE%B0-%E4%BA%BA%E4%BD%93%E5%A7%BF%E6%80%81%E4%BC%B0%E8%AE%A1-eccv-2016-stacked-hourglass-networks-for-human-pose-estimation

【3】https://zhuanlan.zhihu.com/p/45002720

智能血压计

关注

7
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。