首先呢第一次写文章记录自己的无聊时光,因为本次想实现一些简单的程序,没想这种简单的搭建上也遇到了很多坑,在这里详细的记录一下,小白制作,不喜勿喷。希望可以培养成一个新的习惯。
背景
为实现识别英文语音转换文字,上网调研了Speech_recognition的包,以此进行实现。
系统:win 10
python工具:Pycharm
问题一:speech_recognition模块安装不上
在安装这个模块之前需要先安装pocketphinx模块,大家可以自行百度安装,如果那个模块装不上了比如swig,一般来说先进行pip安装,安装成功后还是有这样的问题,那么就需要进行环境变量的配置,在下文中,安装ffmpeg中会详细介绍。
问题二:speech_recognition模块并不支持MP3的转换需要使用到pydub中的AudioSegment进行转换
import speech_recognition as sr
def audio2words():
audio_file = '1.mp3'
r = sr.Recognizer()
with sr.AudioFile(audio_file) as source:
audio = r.record(source)
print('文本内容',r.recognize_sphinx(audio,language='en-US'))
audio2words()
因此,按照以上代码进行运行时报错: