使用 PocketSphinx 进行真正的语音识别

本文介绍了如何在不依赖第三方服务的情况下,使用PocketSphinx进行语音识别。详细讲解了从安装到使用的全过程,包括安装依赖、修改关键文件、测试安装以及英文和中文识别的设置。尽管PocketSphinx默认只支持英文,但通过添加中文模型可以实现中文识别,尽管效果可能不佳。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

我最近一直在搞一个名叫 A. N. N. A. 的 Python 语音机器人项目(Anna 是什么单词的缩写我就不说了,自己猜去),需要用的强大的语音识别技术。翻看全网教程,没有一篇说的通的,要么就是教会如何购买百度AI会员,要么就是教如何翻墙使用谷歌语音……

我最近发现PocketSphinx语音识别很不错,但是全网还是没有哪篇文章会告诉你,如何从头到尾下载这个库,用这个库进行语音识别,并且不在电脑上留下任何垃圾,可以随时删除的安装方法。然后你又会抱怨PocketSphinx有多么垃圾。

在这篇文章里,我将告诉你如何安装pocketsphinx,并将其嵌入speech_recognition库,来更好地实现最终的语音转文字。

电脑环境

  • 系统:macOS Catalina v10.15.3;
  • 软件
    • Xcode v11(版本其实无所谓);
    • Homebrew (安装命令:/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install.sh)"
    • Python 3

安装PocketSphinx

我们先来看一下PocketSphinx的依赖关系图:

PocketSphinx
    |
    |-- SphinxBase
    |  |--libogg
    |  |--libvorbis
    |  |--flac
    |  |--libsamplerate
    |  `--libsndfile
    `-- Swig
         `--PCRE
  1. 打开终端,运行如下brew命令:
$ brew install pcre
$ brew install swig

其中,swigpocketsphinx的依赖,pcreswig的依赖。别听网上瞎说什么swig要自己编译,根本不用,直接用brew安装即可

  1. 再使用brew安装SphinxBase
$ brew install SphinxBase

这个命令会将SphinxBase及其所有依赖安装到电脑上。现在,brew list应该如下:

index_out_of_range@imac ~ % brew list
cmu-sphinxbase	libogg		libvorbis	portaudio
flac		libsamplerate	openssl@1.1	swig
ldid		libsndfile	pcre

注:portaudioldidopenssl是我自己安装的,不用安装。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值