Java对接讯飞语音合成（流式版）WebAPI 经验分享

最新推荐文章于 2024-08-05 15:58:52 发布

帽子实验室

最新推荐文章于 2024-08-05 15:58:52 发布

阅读量3.4k

点赞数 1

分类专栏： Java 算法文章标签：自然语言处理深度学习

本文链接：https://blog.csdn.net/semoon1314/article/details/105331466

版权

本文分享了在开发字幕酱在线工具过程中，如何利用Java对接讯飞的语音合成流式WebAPI，包括接口特点、发音人选择，并提到了小语种的使用注意事项与编码要求。

摘要由CSDN通过智能技术生成

最近在开发字幕酱（https://www.zimujiang.com/），一个自动生成字幕的在线工具，遇到使用讯飞语音合成的需求，这边记录下

讯飞语音合成流式接口将文字信息转化为声音信息，同时提供了众多极具特色的发音人（音库）供您选择，可以在这里在线体验发音人效果。
该语音能力是通过Websocket API的方式给开发者提供一个通用的接口。Websocket API具备流式传输能力，适用于需要流式数据传输的AI服务场景。相较于SDK，API具有轻量、跨语言的特点；相较于HTTP API，Websocket API协议有原生支持跨域的优势。

原WebAPI普通版本接口(http[s]: //api.xfyun.cn/v1/service/v1/tts) 不再对外开放，已经使用WebAPI普通版本的用户仍可使用，同时也欢迎体验新版流式接口并尽快完成迁移~

小语种及少数民族方言：

目前新增：韩语、日语、维吾尔语、藏语、法语、俄语、西班牙语、印地语、德语、越南语、巴西葡萄牙语、意大利语、葡萄牙语、泰语、乌尔都语；
使用小语种时上传文本编码必须使用unicode编码且设置tte=unicode（unicode即utf16小端的编码方式）；
需先在控制台开启小语种发音人才可合成小语种，否则报错11200。

package com.iflytek.voicecloud.webapi.demo;

import com.google.gson.Gson;
import com.google.gson.JsonObject;
import okhttp3.*;
import okio.ByteString;

import javax.crypto.Mac;
import javax.crypto.spec.SecretKeySpec;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.net.URL;
import java.nio.charset.Charset;
import java.text.SimpleDateFormat;
import java.util.Base64;
import java.util.Date;
import java.util.Locale;
import java.util.TimeZone;

/**
 * 语音合成流式 WebAPI 接口调用示例 接口文档（必看）：https://www.xfyun.cn/doc/tts/online_tts/API.html
 * 语音合成流式WebAPI 服务，发音人使用方式：登陆开放平台https://www.xfyun.cn/后，到控制台-我的应用-语音合成-添加试用或购买发音人，添加后即显示该发音人参数值
 * 错误码链接：https://www.xfyun.cn/document/error-code （code返回错误码时必看）
 * 小语种需要传输小语种文本、使用小语种发音人vcn、ent=mtts、tte=unicode以及修改文本编码方式
 * @author iflytek
 */

public class WebTTSWS {
    private static final String hostUrl = "https://tts-api.xfyun.cn/v2/tts"; //http url 不支持解析 ws/wss schema
    private static final String appid = "XXXXXXXX";//到控制台-语音合成页面获取
    private static final String apiSecret = "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX&#