python 语音识别离线_语音识别离线语音识别,SpeechRecognition

最新推荐文章于 2024-06-29 23:50:00 发布

LaserComposites

最新推荐文章于 2024-06-29 23:50:00 发布

阅读量662

点赞数

文章标签： python 语音识别离线

本文链接：https://blog.csdn.net/weixin_28816215/article/details/114402693

版权

这篇博客介绍了如何在Python中实现离线语音识别，主要涉及PocketSphinx的安装、SpeechRecognition库的安装以及中文模型的配置。通过修改源代码、安装依赖并调整模型文件，可以对wav和flac格式的音频文件进行中文和英文的语音转文字。

摘要由CSDN通过智能技术生成

一、PocketSphinx 安装

1、RedHat/CentOS:

yum install pulseaudio-libs-devel

Ubuntu/Debian:

apt install libpulse-dev

2、git clone --recursive https://github.com/bambocher/pocketsphinx-python

3、cd pocketsphinx-python

4、vim pocketsphinx-python/deps/sphinxbase/src/libsphinxad/ad_openal.c

Change

#include

5、python setup.py install

二、SpeechRecognition安装

pip install SpeechRecognition

三、中文模型安装

1、下载 cmusphinx-zh-cn-5.2.tar.gz

地址：

https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Mandarin/

2、解压后重命名部分文件：

cmusphinx-zh-cn-5.2 -> zh-CN

zh_cn.cd_cont_5000 -> acoustic-model

zh_cn.lm.bin -> language-model.lm.bin

zh_cn.dic -> pronounciation-dictionary.dict

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注