Python调用百度语音合成SDK实现文字转音频

百度语音合成

https://cloud.baidu.com/doc/SPEECH/s/Ik4nlz8l6

安装百度语音Python SDK

pip install baidu-aip

AipSpeech是语音合成的Python SDK客户端,为使用语音合成的开发人员提供了一系列的交互方法。

初始化AipSpeech

from aip import AipSpeech

""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

在上面代码中,常量APP_ID在百度云控制台中创建,常量API_KEYSECRET_KEY是在创建完毕应用后,系统分配给用户的,均为字符串,用于标识用户,为访问做签名验证,可在AI服务控制台中的应用列表中查看。

配置AipSpeech

如果用户需要配置AipSpeech的网络请求参数(一般不需要配置),可以在构造AipSpeech之后调用接口设置参数,目前只支持以下参数:

接口说明
setConnectionTimeoutInMillis建立连接的超时时间(单位:毫秒
setSocketTimeoutInMillis通过打开的连接传输数据的超时时间(单位:毫秒)

语音合成

  • 合成文本长度必须小于1024字节,如果本文长度较长,可以采用多次请求的方式。文本长度不可超过限制
result  = client.synthesis('培根芝士', 'zh', 1, {'spd':5,'vol': 5,'per':4})

# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
    with open('output.mp3', 'wb') as f:
        f.write(result)

参数说明: 

参数类型描述是否必须
texString合成的文本,使用UTF-8编码,
请注意文本长度必须小于1024字节
cuidString用户唯一标识,用来区分用户,
填写机器 MAC 地址或 IMEI 码,长度为60以内
spdString语速,取值0-9,默认为5中语速
pitString音调,取值0-9,默认为5中语调
volString音量,取值0-15,默认为5中音量
perString发音人选择, 0为女声,1为男声,
3为情感合成-度逍遥,4为情感合成-度丫丫,默认为普通女

返回样例:

// 成功返回二进制文件流
// 失败返回
{
    "err_no":500,
    "err_msg":"notsupport.",
    "sn":"abcdefgh",
    "idx":1
}

错误返回格式

若请求错误,服务器将返回的JSON文本包含以下参数:

  • error_code:错误码。
  • error_msg:错误描述信息,帮助理解和解决发生的错误。

错误码:

错误码含义
500不支持的输入
501输入参数不正确
502token验证失败
503合成后端错误


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值