Python中用SpeechRecognition库和 vosk模型来识别语音

本文介绍了如何在Python中使用SpeechRecognition库进行语音识别,包括安装、导入、麦克风录音、识别文件以及使用Vosk模型进行中文识别的过程。作者还分享了实际操作中关于模型选择和加载的细节。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Python中的SpeechRecognition库是一个比较好用的语音识别模块,提供了将语音识别成文字的方法,支持中文识别。

一、SpeechRecognition库的安装

使用pip命令安装即可:

​pip install SpeechRecognition

当安装不成功时,可以强制:

​pip install --force- SpeechRecognition

二、SpeechRecognition库的导入:

import speech_recognition as sr
r = sr.Recognizer()

注意:导入库的名称与安装名称的略有不同。

三、识别麦克风输入的语音:

# 麦克风录音
mic = sr.Microphone()
with mic as source:
    print("请说话...")
    r.adjust_for_ambient_noise(source)
    audioData = r.listen(source)
    # print(type(audioData))

四、或者直接识别语音文件:

# 识别语音文件
audioFile = sr.AudioFile("渔父.mp3")
with audioFile as source:
   audioData = r.record(source)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值