每日记录论文1-TEMPO: Efficient Multi-View Pose Estimation, Tracking, and Forecasting（ICCV 2023）

最新推荐文章于 2024-08-27 22:16:38 发布

kimmich0615

最新推荐文章于 2024-08-27 22:16:38 发布

阅读量287

点赞数 6

分类专栏：每日论文记录-多目3D人体姿态检测文章标签：计算机视觉人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_54144584/article/details/133172040

版权

每日论文记录-多目3D人体姿态检测专栏收录该内容

17 篇文章 1 订阅

订阅专栏

论文链接：[2309.07910] TEMPO: Efficient Multi-View Pose Estimation, Tracking, and Forecasting (arxiv.org)

代码链接：

作者即将公布

1.简介：

该篇文章提出了TEMPO，是一种高效的多视图姿态估计模型，其学习了一种鲁棒的时空的表示，提高了姿态精度的同时进行了跟踪人体与预测未来的姿势。

2.项目流程图：

3.项目原理（只包含person detection）：

根据之前的工作，作者将根关节定义为髋关节中段（mid-hip）。在给定的时间t，检测器模块将一组N个图像作为输入，每个图像对应于在时间t相同场景的不同相机视图。对于每个图像，我们用预训练的主干提取特征，得到N个特征图 $F_1^{T},F_{2}^{T},F_{3}^{T},...F_{N}^{T}$

根据每个视图 $C_{1}^{T},C_{2}^{T}....C_{N}^{T}$ 相机矩阵，采用双采样过程，所以对一个voxel，有

$v=\sum_{i=1}^{N}F_{i}^{t}(C_{i}x)$

然后，我们通过沿z轴取最大值来计算V的鸟瞰图表示：

$F_{BVE}^{t}=\underset{z}{max}V$

从场景中的每个关节的（x,y）位置的 $F_{BEV}^{t}$ 生成的2D heatmap,记作 $H^{t}$ ,从中前K个位置进行采样，得到K个proposals，然后对其进行1D CNN的回归其根关节高度，记作 $H_{k}^{t}$ ,然后对最大的z轴进行采样，获得 $D_{t}={(x1,y1,z1),(x2,y2,z2)...(xk,yk,zk))}$ ,最后用多头2D CNN回归宽度

长度、中心点给每个proposal。

损失函数有三块，分别从1D heatmap,2D heatmap,边界框回归

$L_{det}=L_{2D}+L_{1D}+L_{bbox}$

之后预测每个平面中每个关节的2D位置，并将预测的2D位置融合在一起，形成3D骨架，每个特征图通过2D CNN来解码三个平面中每个平面中每个人关节的关节似然热图，并且利用学习的加权网络将来自每个平面的2D关节预测融合到3D中。将预测姿态的损失定义为计算的2D热图和GT热图之间的均方损失，以及预测关节位置和GT的L1损失

4.数据对比

5.效果图

关注

6
点赞
踩
2

收藏

觉得还不错? 一键收藏
3
评论
每日记录论文1-TEMPO: Efficient Multi-View Pose Estimation, Tracking, and Forecasting（ICCV 2023）

论文记录
复制链接

扫一扫

专栏目录

kimmich0615 CSDN认证博客专家 CSDN认证企业博客

码龄4年

17: 原创

129万+: 周排名

29万+: 总排名

3214: 访问

: 等级

255: 积分

257: 粉丝

80: 获赞

14: 评论

17: 收藏

私信

关注

热门文章

分类专栏

每日论文记录-多目3D人体姿态检测 17篇

最新评论

每日论文记录15-Faster VoxelPose: Real-time 3D Human PoseEstimation by Orthographic Projection（ECCV2022）
流星芭比锤: 你好大佬，请问您阅读这篇论文代码和用自己的数据集实现了吗
每日论文记录3-Learnable Triangulation of Human Pose（ICCV2019）
CSDN-Ada助手: 恭喜您连续创作第三篇博客！您选择的论文题目“Learnable Triangulation of Human Pose（ICCV2019）”听起来非常有趣。通过记录每日论文，您不仅展示了自己对学术研究的热爱，还让读者们有机会了解最新的研究成果。我鼓励您继续坚持创作，并将您的见解与读者分享。在下一篇博客中，您可以考虑加入一些个人观点和对论文的实际应用进行探讨，这将使您的博客更加有深度和价值。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
每日论文记录6-Multi-View Multi-Person 3D Pose Estimationwith Uncalibrated Camera Networks（BMVC2022）
CSDN-Ada助手: 恭喜您撰写了第6篇博客！标题“每日论文记录6-Multi-View Multi-Person 3D Pose Estimation with Uncalibrated Camera Networks（BMVC2022）”引人入胜。您对多视角多人三维姿态估计与非校准相机网络的探索真是令人赞叹！我对您持续创作的热情和努力表示赞赏。作为下一步的创作建议，或许您可以考虑进一步探索该领域中的挑战和应用场景。分享一些实际案例，或者提供一些实用的技巧和方法，将使您的博客更具实践性。同时，对于那些想要深入了解该领域的读者，您可以提供一些参考文献或者资源链接，以便他们进一步学习。再次恭喜您的连续创作，并期待您未来更多精彩的博客！
每日论文记录17-Real-Time Multi-View 3D Human Pose Estimationusing Semantic Feedback to Smart Edge Sensors
CSDN-Ada助手: 恭喜您撰写了第17篇博客！标题“每日论文记录17-Real-Time Multi-View 3D Human Pose Estimation using Semantic Feedback to Smart Edge Sensors”听起来非常引人注目。您对实时多视角3D人体姿态估计的研究非常有深度，通过智能边缘传感器的语义反馈，这一领域的发展前景非常令人兴奋。继续保持创作的热情和努力，您所分享的论文记录对读者来说是非常有价值的资源。对于下一步的创作建议，我谨提醒您保持谦虚的态度。或许您可以考虑进一步探索该领域中其他相关的前沿技术，或者分享一些与您的研究相关的实际案例和应用场景，这将进一步丰富您的博客内容。期待您未来更多博客的发布！
每日记录论文1-TEMPO: Efficient Multi-View Pose Estimation, Tracking, and Forecasting（ICCV 2023）
简单简单小白: 非常详细，很棒！

大家在看

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。