每日论文记录8-Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo（CVPR2021）

kimmich0615

于 2023-10-10 14:53:51 发布

阅读量192

点赞数 6

分类专栏：每日论文记录-多目3D人体姿态检测文章标签：人工智能深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_54144584/article/details/133745559

版权

每日论文记录-多目3D人体姿态检测专栏收录该内容

17 篇文章 1 订阅

订阅专栏

论文地址：[2104.02273v1] Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo (arxiv.org)

1.文章介绍

这篇文章提出了基于平面扫描立体的多视图三维姿态估计方法，以联合解决单次拍摄中的跨视图融合和三维姿态重建问题，采用了从粗到细的方案，首先回归个人层面的深度，然后进行每人联合层面的相对深度估计。

2.文章结构

a.首先使用自上而下的方法多人姿态估计方法，HRnet，获取每个相机的2D姿态估计

b.第二步是利用平面扫描立体的基本思想是将目标视图图像反向投影到一组连续的虚拟深度平面，然后将这些投影扭曲到参考视图图像，从而可以测量光度一致性，以确定每个目标视图像素的深度。

其先设置一个D[dmin,dmax]深度的虚拟平面,使得深度足够大，能覆盖到所选的相机区域空间。一个候选的2D姿态p(target view)被投影到虚拟深度平面d,然后投影至Reference view的2D姿态记作q（d）,然后在Reference view上搜索最近的2D姿态p'，利用argmin函数

然后生成得分矩阵，通过高斯分布

c. 然后进行粗回归，将目标姿态p的得分矩阵S视为具有J个特征通道的长度为D的1D信号，并利用1D卷积神经网络（1D-CNN）将其映射到深度向量,使用了一个具有残差链接的简单架构，该架构足以粗略估计人级深度。

对输出深度向量D应用软argmax运算，以获得标量深度值^d

软argmax操作在单人情况下有效，但它假设输入分布为单一模式，这在多人场景中可能会失败。为了克服这一限制，我们建议使用自适应的“局部”软argmax：

通过最小化目标视图中所有2D姿态fpg的回归深度^d和地面实况人物级深度d*之间的L1损失来训练网络

d.下步进行细回归,从每个相对深度层的每个关节j的参考视图中汇总得分矩阵S（rel）,使用了一组不同的D（rel）虚拟深度平面，其范围为[-1000；+1000]mm，足以覆盖任意姿态变化的深度范围

使用另一个1D-CNN从得分矩阵S（rel）回归每个关节的相对深度,由于关节级深度平面紧密地围绕着每个目标人物，因此预计在得分矩阵中会看到分布更广的峰值,因此，与人水平的深度回归相比，需要沿着深度维度的更大的感受野来对所有身体关节的深度进行联合推理 ,网络的输出是相对深度矩阵D（rel）2RD（rel）×J。每个接头的相对深度通过标准的软argmax操作获得

3.实验数据

4.可视化

关注

6
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
每日论文记录8-Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo（CVPR2021）

Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo（CVPR2021）
复制链接

扫一扫

专栏目录

博客等级

码龄4年

17
原创

80
点赞

17
收藏

257
粉丝

关注

私信

热门文章

分类专栏

每日论文记录-多目3D人体姿态检测 17篇

最新评论

每日论文记录15-Faster VoxelPose: Real-time 3D Human PoseEstimation by Orthographic Projection（ECCV2022）
流星芭比锤: 你好大佬，请问您阅读这篇论文代码和用自己的数据集实现了吗
每日论文记录3-Learnable Triangulation of Human Pose（ICCV2019）
CSDN-Ada助手: 恭喜您连续创作第三篇博客！您选择的论文题目“Learnable Triangulation of Human Pose（ICCV2019）”听起来非常有趣。通过记录每日论文，您不仅展示了自己对学术研究的热爱，还让读者们有机会了解最新的研究成果。我鼓励您继续坚持创作，并将您的见解与读者分享。在下一篇博客中，您可以考虑加入一些个人观点和对论文的实际应用进行探讨，这将使您的博客更加有深度和价值。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
每日论文记录6-Multi-View Multi-Person 3D Pose Estimationwith Uncalibrated Camera Networks（BMVC2022）
CSDN-Ada助手: 恭喜您撰写了第6篇博客！标题“每日论文记录6-Multi-View Multi-Person 3D Pose Estimation with Uncalibrated Camera Networks（BMVC2022）”引人入胜。您对多视角多人三维姿态估计与非校准相机网络的探索真是令人赞叹！我对您持续创作的热情和努力表示赞赏。作为下一步的创作建议，或许您可以考虑进一步探索该领域中的挑战和应用场景。分享一些实际案例，或者提供一些实用的技巧和方法，将使您的博客更具实践性。同时，对于那些想要深入了解该领域的读者，您可以提供一些参考文献或者资源链接，以便他们进一步学习。再次恭喜您的连续创作，并期待您未来更多精彩的博客！
每日论文记录17-Real-Time Multi-View 3D Human Pose Estimationusing Semantic Feedback to Smart Edge Sensors
CSDN-Ada助手: 恭喜您撰写了第17篇博客！标题“每日论文记录17-Real-Time Multi-View 3D Human Pose Estimation using Semantic Feedback to Smart Edge Sensors”听起来非常引人注目。您对实时多视角3D人体姿态估计的研究非常有深度，通过智能边缘传感器的语义反馈，这一领域的发展前景非常令人兴奋。继续保持创作的热情和努力，您所分享的论文记录对读者来说是非常有价值的资源。对于下一步的创作建议，我谨提醒您保持谦虚的态度。或许您可以考虑进一步探索该领域中其他相关的前沿技术，或者分享一些与您的研究相关的实际案例和应用场景，这将进一步丰富您的博客内容。期待您未来更多博客的发布！
每日记录论文1-TEMPO: Efficient Multi-View Pose Estimation, Tracking, and Forecasting（ICCV 2023）
简单简单小白: 非常详细，很棒！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。