使用 PocketSphinx 进行真正的语音识别

最新推荐文章于 2025-03-09 20:46:28 发布

7LH0rse

最新推荐文章于 2025-03-09 20:46:28 发布

阅读量9.4k

点赞数 8

分类专栏： Python 文章标签：语音识别人工智能深度学习神经网络 python

本文链接：https://blog.csdn.net/qq_45415111/article/details/105815752

版权

本文介绍了如何在不依赖第三方服务的情况下，使用PocketSphinx进行语音识别。详细讲解了从安装到使用的全过程，包括安装依赖、修改关键文件、测试安装以及英文和中文识别的设置。尽管PocketSphinx默认只支持英文，但通过添加中文模型可以实现中文识别，尽管效果可能不佳。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

我最近一直在搞一个名叫 A. N. N. A. 的 Python 语音机器人项目（Anna 是什么单词的缩写我就不说了，自己猜去），需要用的强大的语音识别技术。翻看全网教程，没有一篇说的通的，要么就是教会如何购买百度AI会员，要么就是教如何翻墙使用谷歌语音……

我最近发现PocketSphinx语音识别很不错，但是全网还是没有哪篇文章会告诉你，如何从头到尾下载这个库，用这个库进行语音识别，并且不在电脑上留下任何垃圾，可以随时删除的安装方法。然后你又会抱怨PocketSphinx有多么垃圾。

在这篇文章里，我将告诉你如何安装pocketsphinx，并将其嵌入speech_recognition库，来更好地实现最终的语音转文字。

电脑环境

系统：macOS Catalina v10.15.3；
软件
- Xcode v11（版本其实无所谓）；
- Homebrew （安装命令：/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install.sh)"）
- Python 3

安装`PocketSphinx`

我们先来看一下PocketSphinx的依赖关系图：

PocketSphinx
    |
    |-- SphinxBase
    |  |--libogg
    |  |--libvorbis
    |  |--flac
    |  |--libsamplerate
    |  `--libsndfile
    `-- Swig
         `--PCRE

打开终端，运行如下brew命令：

$ brew install pcre
$ brew install swig

其中，swig是pocketsphinx的依赖，pcre是swig的依赖。别听网上瞎说什么swig要自己编译，根本不用，直接用brew安装即可

再使用brew安装SphinxBase：

$ brew install SphinxBase

这个命令会将SphinxBase及其所有依赖安装到电脑上。现在，brew list应该如下：

index_out_of_range@imac ~ % brew list
cmu-sphinxbase	libogg		libvorbis	portaudio
flac		libsamplerate	openssl@1.1	swig
ldid		libsndfile	pcre

注：portaudio、ldid和openssl是我自己安装的，不用安装。

最低0.47元/天解锁文章

使用 PocketSphinx 进行真正的语音识别

目录

前言

电脑环境

安装PocketSphinx

安装`PocketSphinx`