语音生成工具:CosyVoice!为角色生成个性化语音

 Datawhale学习 

实践:AI+语音生成,出品方:魔搭社区

每个角色有自己的性格、形象,那也一定需要自己个性化的声音。

来介绍一个超实用的语音生成工具:CosyVoice

  • 体验创空间:https://www.modelscope.cn/studios/iic/CosyVoice-300M

  • GitHub:https://github.com/FunAudioLLM/CosyVoice

01

案例设定

【角色设定】

留洋归来的大小姐

【角色形象】创作方法详见上一篇《影视与游戏行业AI视频制作实战:第一步,角色形象设计的一致性》

cc9176ebeb5b5cf409cf2c991571a37d.png

【语音文本】父亲,我在国外学到了很多新知识,希望能用这些知识来帮助我们的家族企业![laughter]我相信你一定会支持我的!

02

功能实操

推荐工具:

https://www.modelscope.cn/studios/iic/CosyVoice-300M

1、使用预置音色

1f95020afa438bfea83bdfee37a78f15.png

点评:比较中规中矩的播音腔,但笑声[laughter]融入得比较自然。

2、学习样本声音

通过录制学习样本:

b90bd7d9c469fd09f8d5d96ee673853a.png

生成效果如下:

点评:将大小姐的声音学得非常灵动,融入了自然的撒娇口吻。

3、详细描述一个音色

5c9936fa2b11ccb5f3e83a37d427fafa.png

描述词:年轻女性,带着悲伤的情绪

点评:悲伤的情绪很自然地融入到文本中,将同样的文本演绎出了完全不同的剧情感。

03

挑战赛:语音故事创作

如果你熟练掌握了这些语音生成方式,还可以来挑战以下比赛

e855a5f50827f4ec36a7abe382f32534.png

点击阅读原文,即可参加比赛~


👇点击关注ModelScope公众号获取

更多技术信息~

### CosyVoice 文字转语音功能介绍 CosyVoice 提供了一种创新的文字转语音(TTS)解决方案,允许用户通过富文本或自然语言形式对生成语音的情感、韵律进行细粒度控制[^1]。这使得最终产生的音频在情感表达方面更加生动和真实。 #### 富文本标记语法示例 为了实现更细腻的声音效果,在输入文本时可以嵌入特定标签来指示不同的情绪状态: ```html <sad>我很伤心。</sad> <happy>今天天气真好!</happy> <angry>你怎么能这样做?</angry> ``` 这些标签可以帮助系统理解并模拟说话者当时的心情变化,从而调整语调、速度等参数以匹配相应情境下的语气特点。 #### 自然语言指令应用实例 除了使用预定义好的HTML风格标签外,还可以直接利用描述性的词语引导TTS引擎如何发音: - **改变音量**: “大声地说:我们赢了!” 或者 “轻声说:晚安。” - **调节速率**: “快速念出:一二三四五。” 或者 “慢慢读一遍这段话...” - **指定情绪**: “带着愤怒讲这句话…” 或者 “用愉快的方式告诉我…” 这种灵活性让用户能够轻松创建具有高度个性化特征的合成声音文件,极大地增强了用户体验的质量与多样性。 #### Python API 接口示范代码 对于开发者而言,可以通过编程方式集成此服务到自己的应用程序中去。下面是一个简单的Python脚本例子展示了怎样发送带有格式化说明的数据给服务器端API接口完成转换操作: ```python import requests url = 'https://api.cosyvoice.com/tts' headers = {'Authorization': 'Bearer YOUR_API_KEY'} data = { "text": "<happy>Hello, world!</happy>", } response = requests.post(url, headers=headers, json=data) if response.status_code == 200: with open('output.wav', 'wb') as f: f.write(response.content) else: print(f'Error {response.status_code}: {response.text}') ``` 上述程序片段实现了向远程Web服务提交一段包含情感标注的信息字符串,并接收返回来的WAV格式音频流保存至本地磁盘的功能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值