Python语音识别库SpeechRecognition详解及实战指南

最新推荐文章于 2025-05-04 14:45:22 发布

伍畅晗Praised

最新推荐文章于 2025-05-04 14:45:22 发布

阅读量1.2k

点赞数 5

本文链接：https://blog.csdn.net/gitblog_01028/article/details/141153573

版权

Python语音识别库SpeechRecognition详解及实战指南

项目地址:https://gitcode.com/gh_mirrors/py/python-speech-recognition

1. 项目介绍

SpeechRecognition 是一个Python库，用于将人类语言转换为文本。它支持多种语音识别引擎，如Google Web Speech API、Microsoft Bing Voice Recognition和IBM Speech to Text等。这个库以其简单易用和灵活性而受到开发者喜爱，无论是初学者还是经验丰富的开发人员都可以轻松上手。

2. 项目快速启动

安装

首先确保已安装了pip，然后在命令行中运行以下命令来安装speech_recognition库：

pip install SpeechRecognition

快速示例 - 实时语音转文字

下面是一个简单的实时语音转文字的代码示例：

import speech_recognition as sr

# 创建Recognizer实例
r = sr.Recognizer()

# 使用默认麦克风作为音频来源
with sr.Microphone() as source:
    print("请说话:")
    audio = r.listen(source)

try:
    # 使用Google Web Speech API进行识别（需要网络连接）
    text = r.recognize_google(audio, language='zh-CN')
    print(f"你说的是: {text}")
except sr.UnknownValueError:
    print("语音无法识别")
except sr.RequestError as e:
    print(f"服务请求失败: {e}")

请注意，使用recognize_google()方法时可能需要设置适当的API密钥，因为免费配额有限。