【手部姿态估计】【论文精读】3D Hand Shape and Pose Estimation from a Single RGB Image

[Abstract]

本文的工作解决了一个新的和具有挑战性的问题,即从单一RGB图像估计完整的3D手的形状和姿势。目前基于单目RGB图像的手的三维分析方法主要集中于估计手关键点的三维位置,但这不能充分表达手的三维形状。相反,本文提出了一种基于图卷积神经网络(Graph Convolutional Neural Network, Graph CNN)的方法来重建完整的手部三维网格 (mesh),其中包含了更丰富的手部三维形状和姿势信息。为了在完全监督下训练网络,本文创建了一个包含 GroundTruth 三维网格和三维姿态的大规模合成数据集。当在没有3D GroundTruth 数据的情况下对网络进行微调时,本文提出了一种弱监督方法,即利用深度图 (depth) 作为训练过程中的弱监督。通过对本文提出的新数据集和两个公共数据集的广泛评估,表明,我们所提出的方法可以产生精确和合理的三维手部网格,并可以实现优越的三维手部姿态估计精度,与最先进的方法相比。
(摘要指出之前的手部姿态估计方法大多止步于回归三维手部关键点的坐标,作者认为这种抽象后的手部关键点坐标并不能反映手部形态的细节,所以提出了本文的方法用于得到一个更准确的手部shape)

【Introduction】

基于视觉的三维手部分析在虚拟现实(VR)和增强现实(AR)中有着广泛的应用,是一个非常重要的课题。然而,尽管经过多年的研究,由于手的形状、姿势、手势、遮挡等的多样性和复杂性,它仍然是一个悬而未决的问题。在过去的十年中,我们见证了从深度图像中估计三维手部姿态的快速发展。考虑到RGB相机比深度相机更广泛,一些最近的工作开始从单目RGB图像中研究3D手部分析,主要集中在估计稀疏的3D手部关节位置,但忽略了密集的3D hand shape。然而,

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值