近日网上流传了着一段2013 Python大会上的演讲视频。该视频展示了语音编码过程,且速度比一般开发者通过键盘编码速度更快。
视频中 Tavis Rudd 通过语音识别来编写程序( 点击观看视频 )
该视频中的概要内容是:
两年前,我患上了重复性劳损(RSI),十分严重,最后导致我的手开始麻木。我无法工作,无法再敲击键盘。绝望之际,我开始尝试语音识别。起初,通过语音编程慢得让人难受。但毕竟无法打字,我一直忍受着。在以后的几个月里,我不断地进行词汇调整,使用Python和Emacs Lisp进行语音编码,最终我开发了一个系统,它可以帮助我通过语音编程,相比我之前用手编程更快、更高效。
在短暂的现场演示中,我将用Python来创建一个小系统,为了取得更好的效果,我还会用一些其他语言,同时对其进行部署的过程中,不会触碰键盘。通过该演示,我希望让你确信,语音识别不再是残疾人的“拐杖”。现在它是非常高效的工具,所有开发人员可从中获利。
通过该视频,我们可总结出以下几点内容:
他在Windows操作系统中使用 Dragon NaturallySpeaking(Amzon)语音识别软件。(他表示无法使用Linux CMU Sphinx。)(他用的是Mac电脑,显然他是在虚拟机上运行的Windows操作系统。)
Dragon利用Python进行编程,于是他学习了Python,同时也学习了 Python语音识别扩展库DragonFly (由Christo Butcher编写)。所以现在他可以定义自己的语音命令(如键入、移动光标到代码中的某个位置……等等)。
他创造了很多短小特殊/独一无二的短语,依靠它们可以做很多事,如返回插入行,变换Emac缓冲区,启动终端等等。所以,当他语音编程时,你会听到“twip,chirp,slap,derp, …”,十分有趣。
他有大约2000个个人命令。
他表示,他的系统是在Vim、Emacs中完成的。(在演示中,好像只使用了Emacs。)
他证明了在他开发的系统中用Emacs Lisp、Python在Emacs中编码的过程。它比普通程序员用键盘编程更快、更高校。
开发该系统,耗时3~6个月。
现在他的重复性劳损已完全康复,但他表示仍在使用他的语音系统进行编程,大约占到总时间的40%~60%。
他表示,他将在未来的4个月内发布他的代码。大家可以在Twitter( @tavisrudd )、 GitHub 上关注他。
他所推荐使用的麦克风是昂贵的Amzon Audix OM-7 Microphone。
Windows 7中自带有一个语音功能:微软语音识别系统。正常语速下,它可以出色地工作,但无法进行编程。它可以正常工作于普通Windows应用中,尤其是微软的应用程序,如Office,却无法工作于Emacs中。
欢迎加入我爱机器学习QQ14群:336582044
微信扫一扫,关注我爱机器学习公众号