python通过百度api文本转语音（wav）

最新推荐文章于 2024-06-20 14:37:08 发布

嘿656

最新推荐文章于 2024-06-20 14:37:08 发布

阅读量1.2k

点赞数 2

文章标签：语音识别人工智能

本文链接：https://blog.csdn.net/qq_62962418/article/details/126399510

版权

在网上搜索“python通过百度api文本转语音”大部分获得的都是转成mp3格式的音频文件，当后续使用音频文件时，如果要求是wav格式，往往会出现这种报错：

Error: file does not start with RIFF id

如果要解决这个问题，有两种方法。1.python通过百度api文本转语音时获得wav格式的音频文件，本文讲述的就是这种方法。2.通过ffmpeg模块把mp3格式转化成wav格式，我尝试没有成功。

通过搜索发现了转化成mp3的代码：

from aip import AipSpeech

你的百度api
APP_ID = 
API_KEY = 
SECRET_KEY = 

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
tet='你的文本'
result = client.synthesis(tet, 'zh', 3, {
        'vol': 5})

# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
    with open('文件名.mp3', 'wb') as f:
        f.write(result)

只需要增加一句代码就可以生成wav音频文件：

from aip import AipSpeech

你的百度api
APP_ID = 
API_KEY = 
SECRET_KEY = 

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
tet='你的文本'
result = client.synthesis(tet, 'zh', 3, {
        'vol': 5,'aue':6 })

# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
    with open('文件名.wav', 'wb') as f:
        f.write(result)