![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
姿态估计论文阅读
文章平均质量分 90
qian9905
这个作者很懒,什么都没留下…
展开
-
Rethinking Keypoint Representations: Modeling Keypoints and Poses as Objects for Multi-Person Human
.在人体姿态估计这类关键点估计任务当中,基于热图回归的方法是目前最主要最热门的方法,尽管其受限于显著的缺陷:即热图本身受限于一种量化误差且其生成和后处理需要大量的计算开销。为了去找到一种更为有效的解决方案,本文提出了将单独关键点以及一组空间关联的关键点作为目标进行建模的方法,该方法使用了一种密集的单阶段基于锚的检测框架。因此,作者将该方法命名为KAPAO,将关键点和姿态作为目标。原创 2022-11-17 18:17:48 · 603 阅读 · 1 评论 -
【论文阅读】Poseur: Direct Human Pose Regression with Transformers
本文提出了一种直接基于回归的2D人体姿态估计方法,将2D人体姿态估计问题表述为一个序列预测任务,用Transformer网络解决。该网络能够直接学习图像到关键点坐标的直接回归映射而不需要热图表征。该方法避免了基于热图方法的复杂性,为了克服以往基于回归方法中的特征错位问题,作者提出了一种注意力机制以此自适应地学习关注到与目标关键点最相关的特征,大大提高了模型精度。更重要的是,该框架是端到端可微的,能够自然地学习到关键点之间的依赖关系。实验表明在两个主要的数据集上都有着很好的效果,且是第一个超过基于热图方法性能原创 2022-11-02 11:35:40 · 480 阅读 · 2 评论 -
[论文阅读]Contextual Instance Decoupling for Robust Multi-Person Pose Estimation
拥挤场景使得定位不同人体关键点具有挑战性。本文提出了一种上下文实例解耦(CID,Contextual Instance Decoupling)的新多人姿态估计管道(pipeline)。CID不再依赖于人的边界框去空间上区分人。CID将图像中的人体解耦到多个实例感知的特征图中,每个特征图都用来为具体的人体实例推断关键点。与包含边界框检测的方法对比,CID具有可微性和对检测错误具有鲁棒性。将各人体实例解耦到不同的特征图可以隔离各人体实例之间的干扰,并且能够在大于边界框范围的尺度上获取上下文线索。原创 2022-10-26 12:01:03 · 1182 阅读 · 1 评论 -
The Center of Attention: Center-Keypoint Grouping via Attention for Multi-Person Pose Estimation
本文提出了一种利用人体中心点分组,基于注意力机制的框架从一组未划分人体实例的关键点与人体中心点坐标预测估计人体姿态。该方法使用了transformer来获取所有检测到的关键点和中心点的上下文感知嵌入以此直接进行关键点分组。目前的大多数自底向上方法依赖于推理过程中不参与网络训练的聚类操作,本文方法使用了一种完全不同于之前聚类操作的注意力机制进行关键点分组,以此将分组操作与关键点检测一起端到端训练,该方法再提升精度同时具有更快的推理性能。原创 2022-10-21 11:56:42 · 492 阅读 · 0 评论 -
[论文阅读]Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression
该论文关注的是的是自底向上的关键点回归人体姿态估计,作者认为回归关键点坐标的特征必须集中注意到关键点周围的区域,才能够精确回归出关键点坐标。因此了一种名为解构式关键点回归(DEKR)的方法。这种直接回归坐标的方法超过了以前的关键点热度图检测并组合的方法,并且在 COCO 和 CrowdPose 两个数据集上达到了目前自底向上姿态检测的最好结果。原创 2022-10-20 11:49:53 · 440 阅读 · 2 评论 -
FCPose: Fully Convolutional Multi-Person Pose Estimation with Dynamic Instance-Aware Convolutions
本文提出了一个具有动态实例感知卷积的全卷积多人姿态估计网络框架。不同于现有方法通常需要ROI或者后处理分组操作,FCPose使用动态实例关键点估计头部消除了这些操作。该动态关键点头部以每个人体实例为基准条件,将这些实例信息编码到动态卷积的权重当中。由于动态卷积的表征能力强,FCPose中的关键点头部设计得非常紧凑,使得该网络框架推理快速且推理速度相对推理人数具有鲁棒性。FCpose能够比其他SOTA方法达到更好得精度、速度上的平衡。实验结果表明,FCPose也是一种简单搞笑的多人姿态估计框架。原创 2022-10-17 21:51:22 · 874 阅读 · 0 评论