前言
CMU Sphinx(简称Sphinx)是美国卡内基梅隆大学开发的一系列语音识别系统的总称。在2000年,卡内基梅隆的Sphinx小组致力于开源几个语音识别器组件,包括Sphinx 2和后来的Sphinx 3(2001年)。 语音解码器带有声学模型和示例应用程序。可用资源包括声学模型训练软件,语言模型编辑软件和语音词典cmudict。
CMU Sphinx是一个领先的语音识别工具包,具有用于构建语音应用程序的各种工具。 CMU Sphinx包含许多用于不同任务和应用程序的开发包。 有时候,选择什么是令人困惑的。 下面来介绍一下每个开发包的用途:
- Pocketsphinx — lightweight recognizer library written in C (C语言开发的轻量级语音识别引擎)
- Sphinxtrain — acoustic model training tools (声学模型训练工具)
- Sphinxbase — support library required by Pocketsphinx and Sphinxtrain (Pocketsphinx和Sphinxtrain的基础类库 )
- Sphinx4 — adjustable, modifiable recognizer written in Java (Java语言开发的可调节、可修改的语音识别引擎)
sphinxbase 交叉编译安装
本人所使用的版本如下:
sphinxbase-0.8(sphinxbase-0.8.tar.gz)
pocketsphinx-0.8(pocketsphinx_0.8.tar.gz)
(1)解压sphinxbase-0.8.tar.gz
tar xjf sphinxbase-0.8.tar.gz
(2)进入解压的目录内
cd sphinxbase-