文本转语音的接口（开放免费）

叶林染

已于 2023-02-15 08:13:32 修改

阅读量2.2w

点赞数 23

分类专栏：前端文章标签：语音识别

于 2021-04-01 17:11:33 首次发布

本文链接：https://blog.csdn.net/qq_42460461/article/details/115378875

版权

前端专栏收录该内容

18 篇文章

订阅专栏

本文对比了百度、搜狗及有道三家提供的在线语音合成服务接口。详细介绍了各平台的参数设置，包括语言类型、文字编码方式、语速调节及语音类型选择等，为开发者提供了实用的参考。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

百度的开放转换接口

"http://tts.baidu.com/text2audio?lan=zh&ie=UTF-8&spd=4&text=你好啊，听起来好憨啊"

lan 语言类型
- lan=en 英文
- lan = zh 中文
ie 文字编码方式
spd 语速
- 1-9的数字，数字越大，语速越快。
text 要转换的文本

搜狗的开放转换接口

"https://fanyi.sogou.com/reventondc/synthesis?text=%E4%BD%A0%E5%A5%BD%E5%95%8A&speed=1&lang=zh-CHS&from=translateweb&speaker=6"

text 要转换的文本
speed 语速 1~？（我测试到15都还可以）越大，语速越慢
lan 语言类型
- lan=en 英文
- lan = zh-CHS 中文
from 没搞明白（我猜应该是获取你是从哪里请求的，哪种方式请求的）
speaker 语音类型 1-6的数字

有道

	// 这个好听...
 "http://tts.youdao.com/fanyivoice?word=你好，我是你好&le=zh&keyfrom=speaker-target"

word要转换的文本
le 语言类型
- zh 中文
- en 英文

 new Audio("http://tts.youdao.com/fanyivoice?word=你好，我是你好&le=zh&keyfrom=speaker-target").play();

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

叶林染

关注关注

23
点赞
踩
85

收藏

觉得还不错? 一键收藏
13
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

文字转语音 - 搭建微软tts整合web服务提供api接口（免费）

954L

04-20

5841

微软tts是业界公认文字转语音效果最佳本文使用docker搭建微软tts服务并提供api接口对外提供服务。

文本转语音软件，亲测可用调用微软接口，免费使用

01-08

文本转语音软件，亲测可用。调用微软接口，免费使用。适用于文本转成声音的场景，比如给视频配音，不想本人出镜。

13 条评论您还未登录，请先登录后发表或查看评论

C# 文字转语音百度

01-15

通过掉用百度语音合成接口，将文字转换成语音需要提前申请自己的语音合成的 API_KEY，SECRET_KEY

前端文本转语音，语音播放

在职可交流前端开发，包括：web端、uniapp等，欢迎指教。

03-12

1454

把一段文字转成语言。核心方法是：const utterance = new SpeechSynthesisUtterance(‘自定义文本’);window.speechSynthesis.speak(utterance)开始播放

文字转语音的api接口

最新发布

wly476923083的博客

03-12

3780

简单听记能智能区分发言人，剔除口语词，保持内容连贯性，适用于会议记录、电话录音等多种场景，提高工作效率。音疯适合各类音乐创作者，包括初学者、独立音乐人、内容创作者等，旨在激发创意，推动音乐创作的发展。歌曲和音乐创作平台，用户只需输入简单的文本提示词，即可根据流派风格和歌词生成带有人声的歌曲。魔音工坊提供丰富的功能，包括语速调整、多音字选择、停顿控制等，确保文字转语音的效果逼真自然。语音转文字工具，能将音频文件快速转换成文字，支持编辑和格式调整，生成规范的会议纪要。支持中文、英语、德语、法语等。

开源项目&免费接口：文本转语音|API接口

03-21

1767

1.高效的文字转语音技术我们的AI能力引擎采用先进的自然语言处理技术，能够快速准确地将文本内容转换为流畅自然的语音输出。2.丰富的语音合成选项平台提供多种语音选项，包括不同性别、年龄和语言的语音，满足用户多样化的需求。

开源项目免费接口：文本转语音|API接口

hahahaha_1233333的博客

03-27

1657

我们的AI能力引擎采用先进的自然语言处理技术，能够快速准确地将文本内容转换为流畅自然的语音输出。平台提供多种语音选项，包括不同性别、年龄和语言的语音，满足用户多样化的需求。

免费文本转语音（在线文本转语音）

这花开吗

04-20

1550

首先我们用浏览器打开网站 www.text-to-speech.cn ，电脑用户推荐Edge浏览器，手机用户推荐使用QQ浏览器。打开后我们可以在左侧的文本框内写入我们需要生成音频的文本，可以用一件清理删除当前文本框中的内容，写入文本后选择右侧要使用的语言语音等选项，质量越高生成的音频比特率越高，但是会影响生成速度。选择好以后我们可以点击试听去看当前设置的声音是否符合要求，注意试听只会生成并播放第一个句号前的内容。然后我们可以点击生成按钮，等待几秒钟后会有生成成功的音效和文字提示，此时我们就可以下

百度语音API——文本转语音

zm3799的博客

10-12

2471

基于百度语音API的文本转语音。

简单调用一个API实例———（文字转语音）

osako_suguru的博客

03-29

749

超级简单调用一个API实例———（文字转语音），每个人都能学会

文字转语音接口，支持汉字、英语，文字转音频开放接口，还支持翻译播放.txt

08-22

前段时间发现一个好用的接口，支持文字转换成音频，文字支持英语和汉字，也支持语速和自动播放，还有一些功能自己去挖掘吧。应该也支持其他的语言。

调用科大讯飞API实现文本转语音源码

04-20

调用科大讯飞API实现文本转语音该项目采用科大讯飞提供的API接口，使用C语言实现语音合成功能。语音合成功能：用户在文本框输入一段文字，会生成相应语音，可以应用到动画视频场景中。可以选择发音的人物，音量，语速。

原神文本转语音网站源码原神配音网站源码原神文本转语音生成下载源码自带api接.zip

12-22

该压缩包文件包含的是一款基于在线的“原神”文本转语音服务的网站源码，主要功能是将用户输入的文本转化为《原神》游戏风格的语音，供用户下载使用。源码中集成了API接口，可以实现语音生成并提供下载。这个服务...

文本转语音源码-易语言

06-12

【标题】"文本转语音源码-易语言" 涉及到的主要知识点是文本语音合成（Text-to-Speech, TTS）技术以及易语言（EasyLanguage）编程环境的应用。文本语音合成是一种将文本数据转化为可听见的语音输出的技术，广泛应用...

原神配音网站源码：文本转语音功能，自带API接口

09-16

随着互联网技术的迅速发展，文本转语音（Text-to-Speech, TTS）技术已经广泛应用于各种场景，其中在线配音网站是一个典型的例子。本文所提及的“原神配音网站源码”正是这一领域的一个代表性成果。原神，作为一款广...

php文本转语音mp3api源代码,小说文本转音频(百度AI语音合成接口)

weixin_42306938的博客

03-22

793

今天带来的是百度AI的一个语音合成接口，它的主要功能是将接收到的文本内容，转换为音频数据返回。我实现的大致流程为：1 - 爬取小说文本内容(本篇不涉及)2 - 调用百度AI语音合成接口，将文本内容转换为音频数据，并保存到本地文件夹3 - 获取该文件夹内的文件名4 - 将所有音频文件合并为一个output音频文件使用工具：python环境、aip(百度AI)、pydub、os环境准备：1. 百度AI...

调用科大讯飞API实现文本转语音

回头太难

12-02

1万+

text_to_speech 调用科大讯飞API实现文本转语音(wav) 采用科大讯飞提供的API接口，使用C语言实现语音合成功能。语音合成功能：用户输入一段文字，会生成相应语音，可以选择发音的人物，音量，语速。 /* 音频合成参数 */ typedef struct SpeechSynsContext { const char *text; /* 输入文本 */ co...

免费好用的文字转语音工具

nbk2014的博客

10-26

825

自媒体可能是现在最火的东西，自媒体中最火的又是短视频，各家短视频平台都有简单好用的剪辑软件方便新手能轻松上手，但是语音这块的话却没有很好的解决办法，大部分需要真人出声或是拙劣的 AI 配音，但是像我这种普通话不太标准的就很拙计，所以今天把自己一直在用的文字自动生成语音的工具分享给大家。文字转语音软件是来自 AI SMART，河南旭跃网络科技有限公司的产品，据说是基于百度的 AI 技术，首页是付费的，有大批量需求的话可以根据自己的需求进行选择。今天我们提到的是一个隐藏的试听功能，点击此处或公众号“

ffmpeg 音频转文本

07-14

### 回答1： ffmpeg是一种强大的多媒体处理工具，可以用来处理音频、视频等多种格式。尽管ffmpeg本身不直接提供音频转文本的功能，但可以通过结合其他语音识别工具实现音频转文本的需求。在使用ffmpeg之前，我们需要准备好一个用于语音转文本的工具，比如常用的开源工具Google的Speech-to-Text API。首先，我们需要将待转换的音频文件转码为符合Google API要求的格式，比如将其转换为FLAC格式： ``` ffmpeg -i input.wav -vn -ac 1 -f flac output.flac ``` 经过转码后，我们可以使用Google的Speech-to-Text API将FLAC格式的音频文件转换为文本。首先，我们需要安装Google Cloud SDK，然后通过命令行调用API： ``` gcloud auth login gcloud config set project PROJECT_ID gcloud ml speech recognize-long-running gs://BUCKET_NAME/output.flac --language-code='en-US' ``` 其中，PROJECT_ID是Google Cloud项目的ID，BUCKET_NAME是存放音频文件的存储桶名称。这样，Google API会将音频转换为文本，并返回识别结果。在完成音频转换后，我们可以通过解析Google API返回的结果，获取音频的转换文本。总之，通过结合ffmpeg和Google的Speech-to-Text API，我们可以实现音频转文本的功能。虽然ffmpeg本身不提供音频转文本的功能，但通过与其他工具的结合使用，我们可以轻松地实现这一需求。 ### 回答2： ffmpeg 是一个开源的多媒体处理工具，可以进行音频转文本的操作。要将音频转换为文本，可以借助ffmpeg 的音频处理功能以及配套的语音识别技术。首先，需要通过ffmpeg将音频文件转码为支持语音识别的格式，如PCM或WAV。可以使用以下命令将音频文件转码为PCM格式： ``` ffmpeg -i input.mp3 -acodec pcm_s16le -ac 1 -ar 16000 output.wav ``` 其中，`input.mp3` 是待转换的音频文件路径，`output.wav` 是转码后生成的PCM格式音频文件路径。这里的参数`-acodec pcm_s16le` 表示使用16位采样大小，`-ac 1` 表示单声道，`-ar 16000` 表示采样率为16000Hz。转码完成后，可以使用ffmpeg调用配套的语音识别工具进行文本转换。目前常用的语音识别工具有CMU Sphinx和Google Speech Recognition等。这里以CMU Sphinx为例，需要通过命令行执行以下命令： ``` pocketsphinx_continuous -infile output.wav ``` 其中，`output.wav` 是前一步转码得到的PCM格式音频文件。执行命令后，CMU Sphinx 将自动对音频进行语音识别，并将结果输出到终端。另外，也可以使用ffmpeg 配合其他音频识别服务实现音频转文本功能。比如，将转码后的音频文件上传至Google Cloud Speech-to-Text服务，通过API接口获取识别结果。总之，ffmpeg 可以通过转码技术将音频文件转换为支持语音识别的格式，再借助配套的语音识别工具或服务，实现音频转文本的功能。 ### 回答3： FFmpeg是一个功能强大的多媒体处理工具，可以用于音频转文本的操作。要将音频转换为文本，可以使用以下步骤： 1. 安装FFmpeg：首先，需要从FFmpeg的官方网站或其他可信来源下载并安装FFmpeg软件到本地计算机。 2. 准备音频文件：在音频转文本之前，需要确保已经拥有要转换的音频文件。可以是任何格式的音频文件，如MP3、WAV、FLAC等。 3. 转换音频为PCM格式：FFmpeg只能处理PCM格式的音频文件，所以如果音频文件不是PCM格式，需要将其转换为PCM格式。可以使用以下命令将音频文件转换为PCM格式： ffmpeg -i input_audio.mp3 -acodec pcm_s16le -ar 16000 output_audio.wav 这将把名为"input_audio.mp3"的音频文件转换为PCM格式的音频文件，并将转换后的文件保存为"output_audio.wav"。 4. 安装语音识别服务：要将音频转换为文本，需要连接到语音识别服务。可以使用一些开放的语音识别服务如Google Cloud Speech-to-Text、Microsoft Azure Speech to Text或百度语音识别服务。按照提供者的指示创建一个账号并获取API密钥。 5. 使用语音识别服务将音频转换为文本：根据所选择的语音识别服务的文档和API，使用提供的API密钥和转换命令，将PCM格式的音频文件上传并接收识别结果，这将是转换后的音频文本。需要注意的是，音频转文本是一个复杂的过程，可能会受到音频质量、背景噪音等因素的影响。因此，在转换过程中可能需要进行一些额外的音频处理和后期编辑，以确保转换得到准确的文本结果。