姿态估计 - Stacked Hourglass Networks for Human Pose Estimation

最新推荐文章于 2024-04-13 15:42:00 发布

清欢守护者

最新推荐文章于 2024-04-13 15:42:00 发布

阅读量228

点赞数

分类专栏： CV

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/irving512/article/details/112003268

版权

CV 专栏收录该内容

98 篇文章 20 订阅

订阅专栏

文章目录

0. 前言

相关资料：
论文基本信息
- 领域：姿态估计
- 作者单位：密歇根大学
- 发表时间：ECCV 2016
一句话总结：提出了沙漏（hourglass）式的backbone。

1. 要解决什么问题

当时对卷积神经网络在姿态估计中的研究还不充分，还在探索各类新的结果来处理姿态估计问题。
姿态估计的最终目标，是确定各个关键点在原始图像的哪个像素中，所以肯定是downsample再到upsample的过程。

2. 用了什么方法

hourglass的设计灵感来源于——需要提取所有尺寸的信息。
Hourglass的总体结构如下图所示
- 即特征图尺寸不停地缩小、增加、缩小、增加。
对于每一个沙漏，其结构如下
论文中有张图这里放下
- 每个沙漏中的每个方框的结构对应左图。
- 右图介绍了Intermediate Supervision。
  - 怎么翻译，中间监督？怪怪的。
  - 意思就是，网络是由多个hourglass组成的，每个hourglass都要输出一次预测结果（即关键点热力图，下图中蓝色的框），并计算损失函数。

3. 效果如何

当时在FLIC和MPII上都达到了SOTA。现在放图也没有太大用处，毕竟几年前的了，需要的自己看论文吧。
训练细节随便记录一点
- 单人姿态估计问题
- 图像尺寸是256x256
- 数据增强用了旋转
- 损失函数是MSE
- GT使用了2D高斯分布

4. 还存在什么问题&可借鉴之处

应该属于目前姿态估计中常用的backbone了，centernet其实也有使用hourglass作为backbone的情况。
不过感觉这网络还是比较复杂，估计比较大，时间性能一般。

清欢守护者

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
姿态估计 - Stacked Hourglass Networks for Human Pose Estimation

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&可借鉴之处0. 前言相关资料：arxivgithub(mmpose)论文解读（有几张图，比论文原图更清晰）论文基本信息领域：姿态估计作者单位：密歇根大学发表时间：ECCV 2016一句话总结：提出了沙漏（hourglass）式的backbone。1. 要解决什么问题当时对卷积神经网络在姿态估计中的研究还不充分，还在探索各类新的结果来处理姿态估计问题。姿态估计的最终目
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。