python语音识别(语音转文字)

存在问题:
将音频转化成文字进行输出


解决方案:
调用第三方百度的语音识别api进行语音识别

步骤:
1)安装百度提供的Python库:pip install baidu-aip
2)运行以下代码:

from aip import AipSpeech
APP_ID = '160'
API_KEY = 'f6XVtm'
SECRET_KEY = 'zbvyYC'
# 百度AI库获取的参数
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

# 构造读取语音文件函数
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

# 识别本地文件  主函数
result = client.asr(get_file_content(r'F:\PythonFiles\PycharmFile\16k.pcm'), 'pcm', 16000, { 'lan': 'zh',})
#此处地址处必须要加r,使其成为绝对地址,要么容易字符转义出现错误
print(result)

注:
1)百度AI云平台地址:https://ai.baidu.com/
2)进入后添加应用,获取相应的接口ID和密钥(上文提到的三个参数)
3)该接口只支持pcm、wav和amr格式音频
4)程序返回值有4个,如下
在这里插入图片描述
5)存在一个问题,自己录的音总是报3301错误,该错误显示录音效果差,无论怎么录音都显示这个错误

  • 26
    点赞
  • 175
    收藏
    觉得还不错? 一键收藏
  • 12
    评论
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值