谷歌开源手势识别器,手机能用,运行流畅,还有现成的App,但是被我们玩坏了...

郭一璞 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

借助TensorFlow Lite和MediaPipe,谷歌刚刚开源了一款手势识别器,可以直接在手机上运行,实时跟踪,并且已经开源。

官方说,效果长这样:

640?wx_fmt=gif

640?wx_fmt=gif

有了这项应用,你可以开发手语识别、AR游戏,甚至用它来玩石头剪刀布。

640?wx_fmt=gif

有App可玩

谷歌已经把这款手势识别器做成了一款名为“Hand Tracking GPU”的App,在安卓端有对应的apk安装包,下载到手机上,安装成功后,无需联网就可以直接用了。

当然,iOS用户也可以安装,但是没有现成的安装包,可以下载源代码自行编译。

App默认调用前置摄像头,如果屏幕中出现的是你的脸,它是没有反应的。

伸手到屏幕前,就可以和官方演示的一样,识别出手部的各种姿势,123456789都可以识别:

640?wx_fmt=gif

或者比个“OK”:

640?wx_fmt=gif

点个赞:

640?wx_fmt=gif

反应还是非常敏锐的,效果不错。不过,不知是什么原因,有时候玩着玩着,屏幕也会突然“放空”,只能看到手,识别不出手势,这也被推特上的网友抓了包:

640?wx_fmt=gif

另外,这个App只支持一只手的手势识别,如果你把两只手都放到摄像头前,它只能识别一只:

640?wx_fmt=png

说好的石头剪刀布呢?

当然,想想办法还是能让它识别两只手的,比如这样:

640?wx_fmt=gif

 它不知道我换了一只手

悄咪咪的,就把识别出的手势框图从一只手转移到了另一只手上。

640?wx_fmt=gif

 它也不知道我换回来了

当然,你也可以换回来,来去切换自如,仿佛背后的模型已经被忽悠瘸了。

三大模型

不过,被“忽悠瘸了”的锅,可不能让一个模型背,因为,这款应用的背后有3个模型。

640?wx_fmt=png

BlazePalm

从整个图像中界定手部轮廓,找到手掌的位置,检测平均精度达到95.7%。

Hand Landmark

前一个模型找到手掌之后,这个模型负责定位关键点,它可以找到手掌上的21个关节坐标。

在训练过程中,研究人员们用到了将近30000张真实世界的标注过的手掌图片,来获取ground truth数据。

640?wx_fmt=png

之后,用混合训练的方式训练模型。

640?wx_fmt=png

Gesture Recognition

现在,手部关键点检测结果出来之后,需要判断比划出来的手势是什么意思,也就是识别出✌️是2,这里包含各种手势,除了123456789之外,还有yeah、ok等。

不过,遗憾的是似乎App里没有这个功能。

借助MediaPipe实现

最后的实现,借助了MediaPipe,这是一个构建机器学习pipeline的框架。用于手势识别的MediaPipe图长这样:

640?wx_fmt=png

前面的各种模型,都融入到了这张整体的图里,可以看到从拍摄到出结果的全过程。

另外,借助MediaPipe,还可以做人脸检测:

640?wx_fmt=gif

头发分割:

640?wx_fmt=gif

物体检测:

640?wx_fmt=gif

具体内容,可以进入传送门体验:

传送门

MediaPipe

手部跟踪

手势识别apk/源代码

加入社群 | 与优秀的人交流

640?wx_fmt=png

小程序 | 全类别AI学习教程

640?wx_fmt=jpeg

640?wx_fmt=jpeg

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !



  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值