python speech recognition 声音识别

做了一个小小的语音识别的实验

运行环境:

windows 7(自带语音识别模块,不需要另外安装)

python 2.7 32bit

speech(https://pypi.python.org/pypi/speech/0.5.2 https://code.google.com/p/pyspeech/,安装的时候下载的speech的egg包,然后在本地调用 easy install安装完成 python easy_install.py xxxxx.egg)

pywin32 (这个下载32bit或64bit的要和机器上装的python版本对应。一开始我以为自己的机器是64bit的所以安装了64bit的,结果后来发现不行。经过确认发现竟然之前装的python是32bit的)

import speech
import time

response = speech.input("Say something, please.")
speech.say("You said " + response)

def callback(phrase, listener):
    if phrase == "goodbye":
        listener.stoplistening()
    speech.say(phrase)
    print phrase

listener = speech.listenforanything(callback)
while listener.islistening():
    time.sleep(.5)

语音识别一开始效果很差,经过反复训练,开始变的准确很多。嗓子有点哑了。。。。。。。。。。。。

  • 0
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
### 回答1: 使用 pythonSpeechRecognition 库来识别语音可以分为以下几步: 1. 安装 SpeechRecognition 库:在终端或命令行中运行 `pip install SpeechRecognition` 2. 导入库:在你的 python 文件中加入 `import SpeechRecognition as sr` 3. 创建一个 Recognizer 实例:`r = sr.Recognizer()` 4. 使用 `r.record(source)` 录音,其中 source 可以是麦克风或文件。 5. 使用 `r.recognize_google(audio_data, language='zh-CN')` 或其他识别方式,将录音进行识别。 6. 处理识别结果。 示例代码如下: ``` import speech_recognition as sr def transcribe_audio(filepath): # create recognizer and mic instances recognizer = sr.Recognizer() # open the file with sr.AudioFile(filepath) as source: audio_data = recognizer.record(source) # transcribe speech text = recognizer.recognize_google(audio_data, language='zh-CN') # return the result return text ``` 注意:使用 google 识别需要翻墙。 ### 回答2: 使用Python中的SpeechRecognition库可以进行语音识别。首先,需要安装SpeechRecognition库,可以使用以下命令在命令行中安装: ``` pip install SpeechRecognition ``` 安装完成后,可以在Python脚本中导入SpeechRecognition库: ```python import speech_recognition as sr ``` 接下来,可以创建一个Recognizer对象来识别音频。我们可以使用`sr.Recognizer()`来实例化一个Recognizer对象: ```python recognizer = sr.Recognizer() ``` 然后,我们可以使用Recognizer对象来处理音频文件或麦克风录音。例如,我们可以使用`recognizer.record()`方法来录制麦克风输入: ```python with sr.Microphone() as source: print("请说话:") audio = recognizer.record(source, duration=5) # 录制5秒音频 ``` 另外,也可以使用Recognizer对象处理音频文件。例如,`recognizer.audio_file()`方法可以用于打开音频文件,并从中读取音频: ```python audio_file = sr.AudioFile('audio.wav') with audio_file as source: audio = recognizer.record(source) ``` 在获取音频后,我们可以使用Recognizer对象的不同方法来进行语音识别。例如,可以使用`recognizer.recognize_google()`方法将音频转换为文本: ```python try: text = recognizer.recognize_google(audio, language='zh-CN') print("识别结果:" + text) except sr.UnknownValueError: print("无法识别音频") except sr.RequestError: print("请求失败") ``` 需要注意的是,进行语音识别时需要联网,并且要确保音频质量良好,清晰可辨。 ### 回答3: Python SpeechRecognition 是一个用于语音识别的库,可以在Python中进行语音识别和语音转文本的操作。在使用之前,首先需要确保已经安装了SpeechRecognition库。 要使用SpeechRecognition库,可以按照以下步骤进行操作: 1. 安装SpeechRecognition库:在命令行中输入 `pip install SpeechRecognition`,即可安装SpeechRecognition库。 2. 导入SpeechRecognition库:在Python脚本中,使用 `import speech_recognition as sr` 导入SpeechRecognition库。 3. 初始化Recognizer对象:使用 `r = sr.Recognizer()` 初始化一个Recognizer对象,用于进行语音识别操作。 4. 获取语音输入:有多种方式可以获取语音输入,如从麦克风、音频文件或者网络流。例如,从麦克风获取语音输入可以使用 `with sr.Microphone() as source:`。关于不同的语音输入方式可以在SpeechRecognition的文档中查找更详细的内容。 5. 进行语音识别:使用 `r.recognize_sphinx(audio)` 进行语音识别,其中 `audio` 是语音输入的数据。这里的 `recognize_sphinx` 是一个基于开源语音识别引擎CMU Sphinx的识别器,还有其他的识别器可供选择,可以根据需求进行调整。 6. 处理识别结果:根据需要,可以对识别结果进行处理和使用。例如,可以将识别结果输出到屏幕上,或者保存到文件中。 以上就是使用Python SpeechRecognition库进行语音识别的基本操作步骤。在实际使用中,还可以根据需要进行更详细的设置和调整,如选择不同的识别器、设定识别的语言等。可以查看SpeechRecognition库的文档和示例代码,进一步了解和探索其更多的功能和用法。
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值