【手部姿态估计】【论文解读】3D Human Pose Estimation in RGBD Images for Robotic Task Learning

最新推荐文章于 2022-05-20 14:10:33 发布

sxxblogs

最新推荐文章于 2022-05-20 14:10:33 发布

阅读量726

点赞数

分类专栏：姿态估计深度图文章标签：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sunnyblogs/article/details/124317240

版权

本文提出了一种从RGBD图像中估计3D人体姿态的方法，通过结合彩色图像关键点检测和深度信息，超越了单目RGB和深度图像的性能。该方法用于指导服务机器人模仿人类操作，无需手动标记数据。实验表明，这种方法使PR2机器人成功复现了从人类教师那里学到的动作。

摘要由CSDN通过智能技术生成

【Abstract】

我们提出了一种从单个RGBD图像估计真实世界坐标系中的三维人体姿态的方法，并表明它超过了从RGB和仅从depth估计姿态的单目三维姿态估计方法的性能。我们的方法建立在强大的彩色图像人类关键点检测器的基础上，并将深度提升到3D。我们结合系统与我们的学习演示的框架，指导一个服务机器人，而不需要标记。在现实世界中进行的实验表明，我们的方法使PR2机器人能够模仿从人类教师那里观察到的操作动作。
（从摘要上看，本文的方法似乎是从RGB图像中获得2D关键点，再从成对的深度图中获取对应关键点的深度信息从而得到最终的3d关键点坐标，到底本文的方法是不是我们所猜想到的那样，我们看一看具体的网络结构）

【Introduction】

因为本文是一个应用型文章，主要用于解决服务机器人的问题，对我的研究不太相关，故这里就不详细展开。

【Method】

在这里插入图片描述
首先，对RGB图像中的关键点位置进行预测。预测的得分地图沿着z维平铺，从深度地图计算以人为中心的体素网格。基于这些输入，VoxelPoseNet预测3D中的关键点。手周围裁剪的图像被送入HandNormalNet，该网站可以预测出法线。红色和绿色块代表卷积和反卷积操作。连接用⊗表示，⊕是elementwise的添加操作。

在这项工作中，目的是获取3D人体姿态以及手部的方向量。

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。