如何在算家云搭建CosyVoice(文生音频)

一、CosyVoice简介

CosyVoice 是一个开源的超强 TTS(‌文本转语音)‌模型,‌它支持多种生成模式,‌具有极强的语音自然可控性。‌

具有以下特点:

  • 语音合成 :能够将文本转换为自然流畅的语音输出。
  • 多语种支持:支持多种语言的语音合成,例如英语、中文等。
  • 个性化调整:可能支持音色、语速等参数的调整,以实现个性化的语音输出。

可应用于多个场景:

  • 辅助技术 :可用于语音助手、自动电话系统、无障碍辅助等场景,帮助用户更便捷地获取信息。
  • 创意内容创作 :艺术家、内容创作者可以利用其生成独特的声音效果。
  • 教育和培训 :用于创建教育内容或培训材料的语音配音。

二、模型搭建流程

1.容器镜像一键使用

(1)进入算家云的“应用社区”,点击搜索找到"cosyvoice",点击“创建应用”,即可进入容器中心

image.png

image.png

(2)进入容器中心之后会自动匹配模型,选择显卡,点击“立即创建”即可创建实例 

image.png

也可以点击”专业创建“,自主选择 GPU 型号、计费方式等配置

image.png

2. 启动项目

等待实例启动完成,在“项目实例”页面点击对应实例的“WebShell”。

image.png

进入命令操作页后,输入或者复制粘贴以下命令:

cd /CosyVoice/
conda activate cosyvoice
pip install --upgrade modelscope -i https://pypi.tuna.tsinghua.edu.cn/simple
export GRADIO_SERVER_NAME=0.0.0.0
python3 webui.py --port 8080 --model_dir pretrained_models/CosyVoice-300M

image.png

3. 开启外部访问

返回“项目实例”列表,选择并点击对应实例的“更多”-“开放端口”操作。

image.png

有两种访问方式可以选择:本地私密访问和对外开放端口

(1)本地私密访问:选择 ssh 工具访问,登录之后填写各选项,点击“开启代理”

image.png

(2)对外开放端口:请按照下图操作

image.png

4. 获取访问地址,并开始使用

打开浏览器,在地址栏 Ctrl+V 粘贴复制的访问地址进行访问,即可开始使用 CosyVoice

image.png

以上就是在算家云搭建 CosyVoice 的流程,具体使用方式可进入算家云应用社区查看该模型的使用说明。

点击应用社区 (suanjiayun.com),选择模型,一键开启 AI 之旅!

971a4f51b8f1c01ea3fc332bef04cbf.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值