通过Python的speech_recognition库将声音转为文字


前言

大家好,我是空空star,本篇给大家分享一下通过Python的speech_recognition库将声音转为文字。
之前已经介绍了将音频文件转为文字,只依赖speech_recognition库,本篇将声音转为文字,除了speech_recognition库,还要依赖pyaudio库,而且mac用户需要安装PortAudio

Python-语音转文字相关库介绍


一、PortAudio

1.PortAudio是什么?

PortAudio是一种跨平台的音频I/O库,用于实现音频输入和输出功能。它提供了一种简单、一致的跨平台API,可以让开发者在不同操作系统上编写音频应用程序,如音频录制和播放器。PortAudio支持多种音频设备,包括音频接口、音频文件、网络流等,并且可以在各种操作系统上使用,如Windows、Mac OS X、Linux、Unix等。同时,PortAudio还提供了一些高级特性,如流控制、同步、缓冲管理、音频格式转换等。

2.安装PortAudio

macOS下:

brew install portaudio  

二、使用方法

1.引入库

import speech_recognition as sr

2.创建一个Recognizer对象

r = sr.Recognizer()

3.使用麦克风录音,从麦克风录制音频

# 使用麦克风录音
with sr.Microphone() as source:
    print("请说话...")
    # 从麦克风录制音频
    audio = r.listen(source)
    print("录音结束")

4.将音频转换为文字

try:
    # 将音频转换为文字
    text = r.recognize_google(audio, language=‘zh-CN’)
    print(“你说的是:”, text)
except sr.UnknownValueError:
    print(“Google Speech Recognition could not understand audio”)
except sr.RequestError as e:
    print(“Could not request results from Google Speech Recognition service; {0}”.format(e))

5.转换结果

声音:深度神经网络模型部署
请说话…
录音结束
你说的是: 深度神经网络模型部署
Process finished with exit code 0


总结

  • 69
    点赞
  • 58
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 99
    评论
评论 99
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

空空star

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值