关于AI语音的几个创作平台及其使用(二)

本文详述了微软TTS平台的使用方法,包括基本信息、创作步骤和细节调整。用户可通过直接输入、文本软件创作或SSML进行脚本创作,选择丰富的音色并进行试听。此外,还可利用平台的停顿、静音、发音、语调、语速、音高等功能进行精细化调整,以生成高质量的音频。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

平台二

微软TTS:也是一款非常强大的AI配音平台

一、基本信息

(1)、官方链接:https://speech.microsoft.com/audiocontentcreation

(2)、微软的AI语音功能超级强大,而且目前只要注册登录,就能够免费使用。

请添加图片描述

​ (图一)

唯一遗憾的就是注册需要用到国际信用卡,这也算是个小小的门槛。

不过经过测试,目前不登录的话,每天还有几次的免费使用次数,单个字数500字。

请添加图片描述

​ (图二)

对于每天需求量比较少的用户来说,也能用一下,毕竟微软TTS强大的功能还是比较吸引人的。

二、使用方法

1、进入创作页面

打开微软TTS,其中配音部分界面如下:

请添加图片描述

​ (图三)

2、开始创作

我们依然沿着AI语音创作基本步骤一步步深入了解它的使用。

2.1、脚本创作

各个平台,大抵相同

2.1.1、直接在平台文本输入框内进行创作
2.1.2、使用文本软件创作

方法方式很多,比如我们可以用txt,word,ppt等文本软件创作。

2.1.3、SSML

使用SSML语音编写配音脚本。

语音合成标记语言 (SSML) 是一种基于 XML 的标记语言,可用于微调文本转语音输出属性,例如音调、发音、语速、音量等。 与纯文本输入相比,它可以提供更多的控制权和灵活性。

微软TTS支持SSML格式的配音内容输入,文本内容和相关细节设置统一使用SSML语音编写。

对于XML语音不熟悉的使用者,建议没必要使用SSML。

至于对SSML感兴趣的童孩们,可查看官方使用文档:https://learn.microsoft.com/zh-cn/azure/ai-services/speech-service/speech-synthesis-markup

2.1.4、AI创作脚本

AI创作脚本是最高效的方法,比如我们可以用ChatGPT、文心一言等工具创作。

2.2、配音
2.2.1、配音文本输入

主要使用3个方法,分别是手动输入、复制黏贴文本、和SSML

其中手动输入和文本复制黏贴没什么好说的,直接在文本内容框内通过键盘输入或者把创作好的文本内容复制黏贴。

SSML

如图,先切换为SSML输入模式,然后编写或输入SSML脚本即可。

请添加图片描述

2.2.2、选择音色

音色选择是配音的最重要步骤之一,这决定了配音的最终效果。

如图,通过点击右侧的声音,然后选中语言,就可以看到很多的音色选择。

请添加图片描述

通过点击更多,还可以进入更加详细精准的选择页面,如下图:

请添加图片描述

在这里,我们可以通过大类筛选音色,还可以通过语言、性别、年龄等筛选。同时通过点击某个音色,在右侧栏目中还有相应的说话风格可以选择,并且可以进行音色试听。

除此之外,还有音色的部分配音展示,如下图所示:

请添加图片描述

最终点击确认就可以把音色引用当前配音了。

2.2.3、试听

如上文图三中的试听部分,即为配音试听控制。点击播放按钮即可进行试听,配音播放将会从光标的位置开始。

2.3、细节调整

当我们创作好脚本,并且在平台初步配好音后,我们还需要对细节进行更精细的调整。这个过程需要不断地在步骤3和1、2之间切换试听,直到满意为止。

下面是平台具有的可以让我们进行细调的一些强大功能。

2.3.1、停顿

把光标放到要停顿的地方,然后可以使用下图中的标准、高级或者通过自定义时间来设置停顿。

请添加图片描述

2.3.2、静音

(1)把光标放到符合选中静音类型(如下图所示下拉菜单处),选择对应静音类型

请添加图片描述

(2)选择完静音类型后,再设置静音时间,如下图:

请添加图片描述

如此即可以在某个位置设置静音一定时间。

2.3.3、发音

对于具有特殊发音要求的文本,可在此处设置发音方式。

请添加图片描述

2.3.4、语调

我们还可以设置文本配音的语调。如下图,选中需要设置的文本内容后,点击语调中的编辑图标进行编辑。它是通过拖动控制点,然后调整弧线弧度,从而控制语调的高低轻重快慢。

请添加图片描述

2.3.5、语速

选中文本内容后,通过设置数值来设置配音语速。

请添加图片描述

2.3.6、音高

同样,通过选中文本内容后,设置数值改变配音音高。

请添加图片描述

2.3.7、音量

通过选中文本内容后(仅对完整句子生效),设置数值改变配音音量。

请添加图片描述

以上就是我们在配音上的一些细节调整,只要灵活运用,就可以配出优质的音频。

2.4、生成音频

直接点击上文图三所标注下载按钮即可生成音频文件了。

下面该平台默认的文本配音样板,听听它强大的配音能力。

配音样例作品1

2.5、微软TTS的第三方软件

除了使用微软官方的TTS,我们也可以使用它的第三方软件。

如TTS-Vue。

下载链接:https://gitee.com/LGW_space/tts-vue/releases

目前更新到1.9.15版本,不过有一段时间没更新了。

请添加图片描述

安装方法:

下载完成后,我们直接双击exe文件安装。

请添加图片描述

如下图,选中仅为我安装,点击下一步

请添加图片描述

更改安装目录,点击安装

请添加图片描述

点击完成。

请添加图片描述

最终界面如下:

请添加图片描述

该软件支持文本和SSML两种格式的配音文本输入。相比于官方,使用文本输入,某些配置是没有的,只有一些比较重要的。

不过,第三方软件的好处就是免费使用,缺陷就是不知道什么时候它就用不了了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序猿游也

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值