《Stacked Hourglass Networks for Human Pose Estimation》

这是ECCV2016,密歇根大学的研究团队做的工作,后续的很多人体姿态估计方法都借鉴了hourglass网络结构,并进行了改进,可以说hourglass的网络结构算是受到了业界的认可。

1. 研究问题

人体姿态估计任务,需要同时利用局部信息和全局信息。

2. 研究方法

提出沙漏模块,捕获和整合多尺度信息(局部和全局上下文),并且堆叠多个沙漏,重复自下而上,自上而下的推理,结合中间监督的使用,预测人体关键点。

单一沙漏模块

在这里插入图片描述
整个沙漏结构是对称的,输入先经过"bottom-up"过程(池化降采样和一系列的残差块)做特征提取,后经过“top-down”过程(最近邻插值上采样和加法连接)做特征融合,最后基于融合后的特征图预测骨骼关键点。

Fig3 中的每个块都是残差块,残差块只提取特征,不做图像缩放,缩放只在池化和插值中做,从图中可见,每个残差块都输出256个特征图。

在这里插入图片描述

带有中间监督的堆叠沙漏网络

利用单个沙漏网络可以提取多尺度特征,文章使用8个堆叠的沙漏提取更高级的特征,并且在每个沙漏后预测热图进行中间监督,以提高网络的性能。

堆叠沙漏网络

在这里插入图片描述
中间监督
在这里插入图片描述

上图的蓝色块就是预测的热图,然后利用1*1卷积增加维度,和上一级的沙漏输出和本级的沙漏输出叠加,作为下一个沙漏的输入。

3. 实验结果

在这里插入图片描述
在这里插入图片描述

4. 结论

(1)沙漏模块可以提取多尺度信息,有利于人体姿态估计。
(2)堆叠的沙漏以及中间监督过程进一步提升网络的预测能力。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值