《Realtime and Robust Hand Tracking from Depth》读书笔记2

今天全天会议,到晚上八点回来时,“厦大 CV”对论文《Realtime and Robust Hand Tracking fromDepth》的讲解已经开始进行了。我由于全天工作限制没有空看论文,所以只好直接听讲解,快速翻阅了“厦大CV”讲解的内容。

       在今天讲解后,我感觉有几个问题还是需要进一步弄清楚。下面分别说明一下。

手的模型“26 DOF”到底怎么回事?

我后来下载了论文《Efficient model-based 3D tracking of handarticulations using Kinect【2011-BMVC】》和《Markerless and efficient 26-DOF hand poserecovery【2011-ACCV】》,两者够给出了手的模型和图像。两篇论文的图形分别如下:


 

但是由于时间有限,有些细节还是没有看明白。这几篇论文都提到了最初是论文《Construction andAnimation of Anatomically Based Human Hand Models【2003-SIGGRAPH】》最先提出手的26 DOF模型,可惜这篇论文我在校外,下载不了全文,所以也无法知道具体详情。

 

② Z-finger中的计算最佳角度是提到的“1Dintegral histogram”是怎么用的?

在“厦大CV”讲解完之后,就此问题我和“南理_Tracking”讨论过。由于时间关系,这个问题还没有完全解决。我先说一下自己的理解。

首先,如果不用积分直方图,应该有一个笨方法来求解,就是分别计算所有的60度夹角扇区内的像素数目,找处数目最多的一个60度扇区对应的夹角就是我们想寻找的。但是这样计算各个扇区的像素数目太过繁琐,所以要借助积分直方图。但是这里已经用不到了三维信息,所以不需要从深度信息图像中得到直方图。因为明显可以看出Fig4中的红色区域和绿色区域(ring内)没有像素的深浅度的区分。

其次,我觉得这里所谓的直方图不是我们通常意义下的图像处理中的计算某一图像中各个灰度级的像素数目的256维的向量。我个人认为此直方图对应的是角度,指的的在ring内每一个角度对应的射线段中的像素点数,这样转一圈360度,就得到一个360维的直方图。假定此直方图对应的数组为P[360]。

最后再计算积分直方图。从0度开始一直到59度,我们求出P(0)一直到P(59)的和,记为Q(0),代表从0度开始共60度(包括0度)内ring中像素点的数目。接着令Q(1)=Q(0)+P(60)-P(0),代表从1度开始共60度内ring中像素点的数目。这样一直递推下去,到Q(359)=Q(358)+P(58)-P(358),代表从359度开始共60度内ring中像素点的数目。这样就得到一个类似于一维积分直方图的东西。最末一步找到从Q(0)一直到Q(359)中的最大者,那么这个角度θ就是我们所求的:从θ开始的60度角的扇区内像素点数最多。

 

 

由于时间关系,没来得及细写,上述的想法也不一定正确,就是抛砖引玉的作用了。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值