近期,微软发布最新语音技术,支持“情感程度”轻松调节,令智能语音的情感表现力更加细腻可控。
人类的情感很大程度上体现于语音语调的微妙变化,比如一句“再见”,有时是平静而含蓄的,有时是开心而轻松的,有时却是决绝而愤怒的。微软智能语音能够把开心(Cheerful)、悲伤(Sad)、愤怒(Angry)、 恐惧(Fearful)、 不满(Disgruntled)、 严厉(Serious)、撒娇(Affectionate)、温柔(Gentle)、沮丧(Depressed)、尴尬(Embarrassed)、平静(Calm)等情感,以百分之一作为一个量化单元,以平静语气为零点,让虚拟人物即刻拥有成千上万的情感,让内容创作更加有血有肉。据悉,微软人工智能中文语音如晓晓、云希、云野、晓涵、晓萱、晓墨、晓睿均支持“情感程度”调节技术,他们年龄、性别、性格各异。
看微软人工智能语音新技能如何轻松玩转情感程度调节
微软智能语音情感调节以自适应神经网络为基础,开发者可以使用SSML标签(语音合成标记语言),轻松控制情感程度。同时,没有任何编程或SSML标签经验的大众用户也可以通过 有声内容创作平台使用这一功能。
<speak version=“1.0” xmlns=“http://www.w3.org/2001/10/synthesis”
xmlns:mstts=“https://www.w3.org/2001/mstts” xml:lang=“zh-CN”>
<voice name=“zh-CN-XiaoxiaoNeural”>
<mstts:express-as style=“sad” styledegree=“2”>
快走吧,路上一定要注意安全,早去早回。
</mstts:express-as>
</voice>
</speak>
面向开发者:微软智能语音情感程度可调节技术情感程度调节示例1
面向广大用户:微软智能语音情感程度可调节技术情感程度调节示例2
此外,通过与自动文本情感分析技术相结合,微软智能语音技术可自动预测情感类别,智能演绎饱含情绪变化的作品。
微软智能语音情感程度可调节技术,让音频创作就像导演选角一样,用最适合的声音、最恰当的情感,演绎更出色的作品,适用于聊天机器人、有声书朗读、影视自动配音、游戏等多情景。
AI有声内容创作工具: https://speech.microsoft.com/audiocontentcreation