姿态估计 - Deep High-Resolution Representation Learning for Human Pose Estimation

最新推荐文章于 2024-03-21 09:51:15 发布

清欢守护者

最新推荐文章于 2024-03-21 09:51:15 发布

阅读量389

点赞数 1

分类专栏： CV 文章标签： HRNet 姿态估计计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/irving512/article/details/112556074

版权

CV 专栏收录该内容

98 篇文章 21 订阅

订阅专栏

文章目录

0. 前言

相关资料：
- arxiv
- github
- 论文解读（写得很好，值得看）
- 本文中截图来自论文或上面这篇博客
论文基本信息
- 领域：姿态估计
- 作者单位：中国科学技术大学&微软亚洲研究院
- 发表时间：CVPR 2019
一句话总结：提出一种新的backbone设计思路，即不同尺寸的特征图之间进行多次信息融合。

1. 要解决什么问题

为了获取图像中的位置信息（如目标检测、姿态估计、图像分割任务），一种常见的解决方案是增加特征图的尺寸，一般网络就是先下采样再上采样，且下采样、上采样过程中相同尺寸的特征图之间可能有skip connection。
现有的方法如下图
- a是hourglass结构
- b是cascade pyramid结构
- c是simplebaseline结构
- d中使用了空洞卷积

2. 用了什么方法

说白了，就是不同尺寸间特征图相互连接（有FPN的感觉，但也不完全是，毕竟1x的通道从头到尾都有）
不同尺寸间特征图应该如何融合呢

最终结果预测好像用的就是最高尺寸的特征图，其他的没用上。

3. 效果如何

横扫COCO/MPII/PoseTracking

4. 还存在什么问题&可借鉴之处

这种结构应该非常消耗算力和显存吧。毕竟连了这么多。

清欢守护者

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。