论文阅读-Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

最新推荐文章于 2024-09-12 11:41:42 发布

三度就好

最新推荐文章于 2024-09-12 11:41:42 发布

阅读量6.3k

点赞数 1

分类专栏：深度学习论文学习文章标签：深度学习阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yxr403614258/article/details/77977330

版权

深度学习同时被 2 个专栏收录

21 篇文章

订阅专栏

10 篇文章

订阅专栏

Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

（曹哲）作者主页：http://people.eecs.berkeley.edu/~zhecao/#top，论文的贡献还是多人实时和效果

文章代码总共分为两条线

第一条线：求所有的关键点（头，肩膀，手肘，手腕 ... ）

1）一共两个cnn，第一个cnn的输入是原图，输出是热图（每一个热图包含某一种关键点）

2）第二个cnn输入是上一个cnn得到的所有热图，和原图。输出还是热图。

循环直至收敛

第二条线：求所有关节区域

1）一共两个cnn，第一个cnn的输入是原图，输出是热图（每一个热图包含某一种连接（可以简单理解为骨头）区域），其实它们是一整片区域，不过每个地方的概率大小不同。

2）第二个cnn输入是上一个cnn得到的所有热图，和原图。输出还是热图。

循环直至收敛

根据前边两个阶段得到的两个热图，计算哪两个点连接比较好。这就要根据关节区域和点的位置来计算每个像素的小法向。生成一个法向图。

根据前边生成的法向图，第一条线中最后得到的各个点的连线，确定哪两个点的连线的概率最大，找到所有这样的线。找到一个线就可以开始用最小生成树算法来找下一条线，最终得到一个人的骨架，然后得到所有的骨架，如果有连接不完整的，那就残缺的存在就好了。

Paper：

1. Introduction

Pose estimation 的挑战：

1〉图像中不知道多少人，在什么位置，什么尺度

2〉人与人之间因接触，遮挡而变得复杂

3〉实时性的要求，图像中人越多，计算复杂度越大。

A common approach: person detection + pose estimation for each person (top->down)但是存在一定问题：

1.人离得近的时候不容易检测

2.图像中人越多计算时间越长，复杂度越高。

So，提出了bottom up的方法，不存在以上两个问题。利用全局的上下文线索关系来检测部件及其关联。提出了Part Confidence Maps 和 Part Affinity Fields。

输入一幅图像，经过卷积网络提取特征，得到一组特征图，然后分成两个岔路，分别使用 CNN网络提取Part Confidence Maps 和 Part Affinity Fields ，得到这两个信息后，我们使用图论中的 Bipartite Matching 将同一个人的关节点连接起来得到最终的结果。

confidence maps for parts和Part Affinity Fields 都是2D spatial grids, 可以表达由于遮挡和接触而产生的不规则的，多形态不确定性的物体，而且可以用卷积分析。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。