手势识别的整体流程分析

本文转载自http://www.cnblogs.com/tornadomeet/archive/2013/02/26/2933358.html

关于ChaLearn数据库在前面文章ChaLearn Gesture Challenge_1:CGD数据库简单介绍中已经介绍过,当然了,关于该数据库的挑战赛在2012年主办了2场,其比赛结果依次分别在CCPRW2012和ICPRW2012中公布。这2轮比赛过程中官网http://gesture.chalearn.org/中都有对参加比赛的队伍所使用的方法等从感性上做了个调查,并且公布了其调查报告。从这些报告中我们可以参考到做手势识别的大概流程,每个流程中常见的方法是什么,我想这点对初步进入该领域的人来说应该有很大的启发作用。下面就官网发布的第二轮比赛调查Method survey文章来简单分析下。

  从文章中可以看出识别过程主要分为2大部分:预处理及数据表达、识别。

  其中预处理及数据表达又可以细分为很多,比如说图像增强和滤波,这有时候也是需要的,因为识别的视频数据中有不少噪声。文章对比赛获得前8名的方法分析了下,其结果如下:

   

  其中的方法也有不少,比如说去噪,均衡白化,对比度增强,频域变化,背景消除等。特征提取各队伍使用的方法分布如下:

   

  其中包括了常见的HOG/HOF描述等。

  当然了,特征最终提取出来还是要经过维数约简的,如下:

   

  在识别过程中,有可能会使用到时间分割,如下:

   

  很多分割方法和识别是结合在一起的。

 

  当然了,识别过程中比较重要的是手势的表达,这些队伍使用的方法如下:

   

  其中基于可变长度的向量表示最多。

 

  在分类时的相似度测量,使用的方法分布如下:

   

  最后面就是使用的分类器了,如下所示:

   

  可以看出在这些队伍中,用得最多的分类器是最近邻。

 

  现在总结下手势识别系统的大概流程可以如下(当然了,并不是每个步骤都需要的):

  去噪预处理——》时间分割——》特征提取——》维数约简——》特征表示——》分类器设计(可能用到相似度测量).

 

 

  参考资料:

     http://gesture.chalearn.org/

      Method survey

     ChaLearn Gesture Challenge_1:CGD数据库简单介绍

 


  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值