通过语音识别来编程 速度远超键盘

近日网上流传了着一段2013 Python大会上的演讲视频。该视频展示了语音编码过程,且速度比一般开发者通过键盘编码速度更快。

7db082fb0f6e40c17f4ff10c3a9b8a4c.jpg

视频中 Tavis Rudd 通过语音识别来编写程序( 点击观看视频 )

该视频中的概要内容是:

两年前,我患上了重复性劳损(RSI),十分严重,最后导致我的手开始麻木。我无法工作,无法再敲击键盘。绝望之际,我开始尝试语音识别。起初,通过语音编程慢得让人难受。但毕竟无法打字,我一直忍受着。在以后的几个月里,我不断地进行词汇调整,使用Python和Emacs Lisp进行语音编码,最终我开发了一个系统,它可以帮助我通过语音编程,相比我之前用手编程更快、更高效。

在短暂的现场演示中,我将用Python来创建一个小系统,为了取得更好的效果,我还会用一些其他语言,同时对其进行部署的过程中,不会触碰键盘。通过该演示,我希望让你确信,语音识别不再是残疾人的“拐杖”。现在它是非常高效的工具,所有开发人员可从中获利。

通过该视频,我们可总结出以下几点内容:

他在Windows操作系统中使用 Dragon NaturallySpeaking(Amzon)语音识别软件。(他表示无法使用Linux CMU Sphinx。)(他用的是Mac电脑,显然他是在虚拟机上运行的Windows操作系统。)

Dragon利用Python进行编程,于是他学习了Python,同时也学习了 Python语音识别扩展库DragonFly (由Christo Butcher编写)。所以现在他可以定义自己的语音命令(如键入、移动光标到代码中的某个位置……等等)。

他创造了很多短小特殊/独一无二的短语,依靠它们可以做很多事,如返回插入行,变换Emac缓冲区,启动终端等等。所以,当他语音编程时,你会听到“twip,chirp,slap,derp, …”,十分有趣。

他有大约2000个个人命令。

他表示,他的系统是在Vim、Emacs中完成的。(在演示中,好像只使用了Emacs。)

他证明了在他开发的系统中用Emacs Lisp、Python在Emacs中编码的过程。它比普通程序员用键盘编程更快、更高校。

开发该系统,耗时3~6个月。

现在他的重复性劳损已完全康复,但他表示仍在使用他的语音系统进行编程,大约占到总时间的40%~60%。

他表示,他将在未来的4个月内发布他的代码。大家可以在Twitter( @tavisrudd )、 GitHub 上关注他。

他所推荐使用的麦克风是昂贵的Amzon Audix OM-7 Microphone。

Windows 7中自带有一个语音功能:微软语音识别系统。正常语速下,它可以出色地工作,但无法进行编程。它可以正常工作于普通Windows应用中,尤其是微软的应用程序,如Office,却无法工作于Emacs中。

欢迎加入我爱机器学习QQ14群:336582044

getqrcode.jpg

微信扫一扫,关注我爱机器学习公众号

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值