简介
超拟人合成接口是一种先进的文本转音频技术,通过利用大模型生成拟声词,使合成音频更加拟人化和真实。本文将对该接口的主要功能、请求和响应格式、常见错误码等进行总结归纳,帮助用户快速上手并正确使用该接口。
接口描述
超拟人合成接口支持将文本数据合成为音频,音频结果(audio)以多帧形式返回。由于结果帧的顺序可能无法保证,建议在接入方在一定时间片内根据服务响应帧中的 seq
序号进行重排序。
接口功能
请求方法和URL
- 请求方法:
ws(s)://cbm01.cn-huabei-1.xf-yun.com/v1/private/medd90fec
请求格式
请求格式包含 header
、parameter
和 payload
三个部分。以下是一个示例请求协议:
{
"header": {
"app_id": "123456",
"status": 2,
"request_id": "null",
"res_id": ""
},
"parameter": {
"oral": {
"oral_level":"mid"
},
"tts": {
"vcn": &#