前言
我最近一直在搞一个名叫 A. N. N. A. 的 Python
语音机器人项目(Anna 是什么单词的缩写我就不说了,自己猜去),需要用的强大的语音识别技术。翻看全网教程,没有一篇说的通的,要么就是教会如何购买百度AI会员,要么就是教如何翻墙使用谷歌语音……
我最近发现PocketSphinx
语音识别很不错,但是全网还是没有哪篇文章会告诉你,如何从头到尾下载这个库,用这个库进行语音识别,并且不在电脑上留下任何垃圾,可以随时删除的安装方法。然后你又会抱怨PocketSphinx
有多么垃圾。
在这篇文章里,我将告诉你如何安装pocketsphinx
,并将其嵌入speech_recognition
库,来更好地实现最终的语音转文字。
电脑环境
- 系统:
macOS Catalina
v10.15.3; - 软件
Xcode
v11(版本其实无所谓);Homebrew
(安装命令:/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install.sh)"
)Python 3
安装PocketSphinx
我们先来看一下PocketSphinx
的依赖关系图:
PocketSphinx
|
|-- SphinxBase
| |--libogg
| |--libvorbis
| |--flac
| |--libsamplerate
| `--libsndfile
`-- Swig
`--PCRE
- 打开终端,运行如下
brew
命令:
$ brew install pcre
$ brew install swig
其中,swig
是pocketsphinx
的依赖,pcre
是swig
的依赖。别听网上瞎说什么swig
要自己编译,根本不用,直接用brew
安装即可
- 再使用
brew
安装SphinxBase
:
$ brew install SphinxBase
这个命令会将SphinxBase
及其所有依赖安装到电脑上。现在,brew list
应该如下:
index_out_of_range@imac ~ % brew list
cmu-sphinxbase libogg libvorbis portaudio
flac libsamplerate openssl@1.1 swig
ldid libsndfile pcre
注:
portaudio
、ldid
和openssl
是我自己安装的,不用安装。