Paper Reading:Real-time human pose recognition in parts from single depth images

CVPR 2011
Paper:Real-time human pose recognition in parts from single depth images
Author: Jamie Shotton, Andrew Fitzgibbon, Mat Cook, Toby Sharp, Mark Finocchio, Richard Moore, Alex Kipman, Andrew Blake
Association: Microsoft Research Cambridge & Xbox Incubation
Video: Microsoft

Overview
这里写图片描述
单幅深度图像被分割成稠密概率身体组件标签,组件定义为骨骼关节空间上相近的部分,然后将推理出的组件重新投影到世界空间坐标系,然后局部化每个组件的空间分布模式,形成预测。
对身体组件的分割被看作是逐像素分类问题,对每个像素分别评估。从运动数据库中采样了各种不同的姿势,然后生成深度图作为训练数据,训练了一个深度随机森林分类器。
main contribution: 将姿势估计问题变成了物体识别问题

Data
这里写图片描述
在mocap数据库中建立了一个随机渲染管道,先随机采样一组参数,然后使用标准计算机图形学技术从纹理映射3D网络渲染深度和身体组件图像。

Body Part Inference and Joint Proposals
Body part labeling
用颜色编码表示,一些组件定义是用来直接定位感兴趣的特定骨架关节的,其他的是用来填补身体空白或者通过组合来预测其他关节的。我们的中间表示将问题转化成一个能很容易使用高效分类算法解决的问题。

Depth image features
这里写图片描述

这里写图片描述
对身体的一个给定点,无论它离摄像机近还是远,(特征计算)都会给出一个固定的世界空间偏移。对背景中或图像边界之外的偏移像素,深度探针将给出一个大的正常数。

Randomized decision forests
这里写图片描述
森林是T棵决策树的总体,每棵树都有分支节点和叶子节点。对图像I的像素x进行分类时,从根节点开始不断计算得到特征值,然后根据(特征值)与阈值的比较结果往左或者往右分支。树t的叶子节点存储了身体组件标签c的训练出的分布P
这里写图片描述
每棵树都在一个不同的随机的合成样本库上使用下述算法训练得到
这里写图片描述

Joint position proposals
a local mode-finding approach based on mean shift with a weighted Gaussian kernel
这里写图片描述
这保证了密度估计是深度不变的,根据身体组件定义不同,可以通过在少数组件集合中预累加得到后验概率。
对于组件c,我们训练出一个概率阈值,所有概率高于该阈值的像素都作为(mean shift)的起始点。当像素权重之和达到每个模式(mode)时就得到了最终的可信估计。检测出的模式(实际上)位于身体的表面。因此,使用训练出的z偏移将每个模式还原到现场(即身体表面)从而产生最后的关节位置预测。

Experiments
这里写图片描述

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
"Conference on Computer Vision and Pattern Recognition"(计算机视觉与模式识别会议)是一个重要的学术会议,是计算机视觉和模式识别领域的顶级会议之一。该会议由国际计算机科学家和工程师组成的学术界和工业界的专家们参与,并定期举办。这个会议提供了一个促进学术交流、展示研究成果和讨论最新领域进展的平台。 在这个会议上,参与者可以提交他们的研究论文、技术报告和实验结果,以展示他们在计算机视觉和模式识别方面的最新研究进展。评审委员会将选择高质量的论文和报告,并安排它们在会议期间进行展示和讨论。会议包括主题演讲、研讨会、技术展示以及学术交流会等活动。 这个会议为与会者提供了让他们与同行专家和业界人士建立联系、讨论和分享他们的研究成果的机会。在这些交流中,与会者可以从其他研究者的研究中获取新的思路和灵感,同时也可以获得评论和建议来改进自己的工作。此外,会议还可能面向工业界,提供计算机视觉和模式识别领域的最新商业应用和发展趋势。 参加"Conference on Computer Vision and Pattern Recognition"对于从事计算机视觉和模式识别研究的学者和工程师来说,是一个重要的机会。通过参与这个会议,他们可以展示他们的研究成果,拓宽他们的学术视野,扩大他们的合作网络,并与领域内其他研究者共同推动计算机视觉和模式识别领域的发展。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值