TTS (text to speech)
TTS
是Text To Speech
的缩写,即“从文本到语音”。 它将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语(或者其他语言语音)输出的技术,隶属于语音合成(Speech Synthesis
)。
阿里云TTS语音合成
-
语音合成
API
基于达摩院改良的自回归韵律模型,支持文本至语音的实时流式合成。可被应用于: -
智能设备/机器人播报的语音内容,如智能客服机器人、智能音箱、数字人等。
-
音视频创作中需要将文字转为语音播报的场景,如小说阅读、新闻播报、影视解说、配音等。
将合成音频保存为文件
以下代码展示了将流式返回的二进制音频,保存为本地文件。
# coding=utf-8