在网上搜索“python通过百度api文本转语音”大部分获得的都是转成mp3格式的音频文件,当后续使用音频文件时,如果要求是wav格式,往往会出现这种报错:
Error: file does not start with RIFF id
如果要解决这个问题,有两种方法。1.python通过百度api文本转语音时获得wav格式的音频文件,本文讲述的就是这种方法。2.通过ffmpeg模块把mp3格式转化成wav格式,我尝试没有成功。
通过搜索发现了转化成mp3的代码:
from aip import AipSpeech
你的百度api
APP_ID =
API_KEY =
SECRET_KEY =
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
tet='你的文本'
result = client.synthesis(tet, 'zh', 3, {
'vol': 5})
# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
with open('文件名.mp3', 'wb') as f:
f.write(result)
只需要增加一句代码就可以生成wav音频文件:
from aip import AipSpeech
你的百度api
APP_ID =
API_KEY =
SECRET_KEY =
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
tet='你的文本'
result = client.synthesis(tet, 'zh', 3, {
'vol': 5,'aue':6 })
# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
with open('文件名.wav', 'wb') as f:
f.write(result)