Kinect体感交互技术原理
初看Kinect,你或许只看到了3个像摄像头的东西,那么Kinect究竟是怎样实现体感交互的呢?Kinect for Windows SDK又有哪些基本功能呢?接下来将揭开Kinect在硬件、软件方面的神秘面纱。
Kinect的结构组成
下图给出了Kinect的整体结构。Kinect一共有3个摄像头,中间一个是RGB摄像头,用来获取640×480的彩色图像,每秒钟最多获取30帧图像;两边的是两个深度传感器,左侧的是红外线发射器,右侧的是红外线接收器,用来检测玩家的相对位置。Kinect的两侧是一组四元麦克风阵列,用于声源定位和语音识别;下方还有一个带内置马达的底座,可以调整俯仰角。
Kinect的硬件结构
Kinect for Windows SDK 简介及功能介绍
2011年6月17日,微软研究院发布的非商业授权版的Kinect for Windows SDK Beta吸引了众多开发者的目光,不过该版本只允许用于研究、测试和实验,不可以发布商业应用。2012年,微软分别在2月、5月和10月接连发布了商业授权版的Kinect for Windows SDK 1.0版本、1.5版本和1.6版本,此举在明确了微软盈利模式的同时,使得开发者可以进行软件开发,并销售开发的应用程序。
Kinect for Windows SDK目前支持Windows 7操作系统和Windows 8操作系统,开发环境使用Visual Studio 2010 Express及以上版本,支持的开发语言包括C++、C#和VB.NET。
Kinect for Windows SDK主要包括以下几个功能。
-
骨骼追踪:对在Kinect视野范围内移动的一个或两个人进行骨骼追踪,可以追踪到人体上的20个结点(一般是24个节点)。此外,Kinect还支持更精确的人脸识别。
-
深度摄像头:利用“光编码”技术,通过深度传感器获取到视野内的环境三维位置信息。这种深度数据可以简单地理解为一张利用特殊摄像头获取到的图像,但是其每一个像素的数据不是普通彩色图片的像素值,而是这个像素的位置距离Kinect传感器的距离。由于这种技术是利用Kinect红外发射器发出的红外线对空间进行编码的,因此无论环境光线如何,测量结果都不会受到干扰。
-
音频处理:与Microsoft Speech的语音识别API集成,使用一组具有消除噪音和回波的四元麦克风阵列,能够捕捉到声源附近有效范围之内的各种信息。
Kinect for Windows应用领域
目前,国外已经出现了很多使用Kinect开发的精彩应用,比如Kinect试衣镜、Air Presenter演讲软件、Kinect光剑、Kinect街头霸王等。很多创意都可以在MSDN Channel 9的Coding4fun栏目里看到。
在国内,Kinect for Windows SDK Beta发布伊始,微软亚洲研究院便启动了“微软校园菁英计划”之Kinect Pioneer项目,在全国范围内动员微软学生技术俱乐部的同学们集思广益,提交他们基于Kinect的新创意,并向优秀的创意团队提供Kinect设备和技术支持。仅一个多月的开发时间,多个优秀创意团队便成功提交了Kinect创意项目原型,其中包括使用手势进行变脸的3D脸谱虚拟平台、Kinect教学助手、基于Kinect的网上试衣间等。在随后的2012微软精英大挑战Kinect主题上,来自全国30所高校的100余支队伍也积极参与到Kinect for Windows的开发当中,这使得Kinect在中国大学生中得到了全面的推广。
3D脸谱虚拟平台
下面简单介绍一下来自西安电子科技大学团队的3D脸谱虚拟平台。此创意将京剧这门传统艺术和新颖的Kinect技术结合到了一起,通过Kinect搭建了一个可以让京剧迷享受虚拟演唱体验的平台:一个提供脸谱、服装和场景的华丽舞台。凭借着Kinect的人体识别和传感技术,用户可以直接跳过繁复的化妆过程,用手势来选择自己喜爱的角色脸谱,生、旦、净、末、丑,一应俱全,选择完毕后,就可以对着屏幕表演喜爱的曲目并录像了,如图1-3所示。当与其他戏迷朋友分享视频时,他们可以欣赏到惟妙惟肖的场景和表演。这样的方式不仅能使老京剧迷们的交流更加便捷,还能让年轻人通过更炫的途径去了解这门生动的国粹。
kinect光剑
2011年12月2日,由微软亚洲研究院举办的Kinect for Windows研讨会在北京召开,吸引了来自众多行业和研究领域的专家学者以及全国各地的大学老师和学生。研讨会就Kinect的体感交互技术及其应用领域进行了交流和讨论,并且展示了国内基于Kinect for Windows SDK在各个应用领域的研发成果。下面选择一些有代表性的项目进行简要介绍。
-
基于Kinect的手语翻译系统。手语翻译系统旨在解决聋哑人与正常人的沟通问题,利用Kinect对肢体动作的实时捕捉,对特定的手语动作进行识别,最终翻译成文字,这样不懂手语的人也可以跟聋哑人正常交流了。目前,该项目的研究已经取得了重大的进展,我们相信结合Kinect强大的体感交互技术,在不远的将来就会看到Kinect手语翻译系统成为聋哑人的得力助手。
-
空中手写。空中手写软件巧妙地利用了Kinect对手部结点的实时追踪,用户只需对着Kinect在空气中比划,便能写出相应的汉字,并输入到计算机中。该项目为未来的手写输入提供了新的思路。
-
虚拟试衣系统。虚拟试衣系统实现了不需用户真正穿上衣服便可看到衣服上身效果的虚拟试衣体验。用户只需站在屏幕前,选择虚拟试衣系统中存储的品牌衣服图片,系统会根据Kinect获取到的骨架数据自适应地穿在用户在屏幕中的影像上,达到轻轻松松试衣的效果。这样不仅使得试衣变得更加便捷、有趣,还能有效减少试衣成本。
-
Kinect版水果忍者。Kinect版水果忍者也是利用了Kinect的骨骼追踪技术,将触屏版的水果忍者游戏移植到Kinect的体感控制上。Kinect追踪玩家双手的移动轨迹,玩家只需对着屏幕划动双手便可切下水果,俨然真实版忍者,在娱乐的同时还能锻炼身体。
Xbox 360 Kinect Teardown
小结
Kinect是一种廉价的动作捕捉设备,适用于对动作捕捉精度要求非常严格的领域,这也是其未来发展的方向。另外,现在智能手机和平板电脑的发展非常迅猛,虽然现在看它们和PC会怎样发展,还没有定论,但是受此趋势影响,Kinect以后绝对会趋于小型化,可以断定这是其发展的必经之路。大家都知道,专业领域的产品用量通常不会很大,但是这个领域的技术更新相对较快,随着技术的完善,最终专业领域的技术一定会逐渐应用到消费者领域。互联网的发展历史就是很好的明证,其他许多成功普及的技术也都遵循着这样的发展轨迹。