教程|腾讯云高性能应用服务(HAI)搭建多音色控制的TTS引擎

在这篇文章中,我们将介绍如何使用腾讯云的高性能应用服务(HAI)来搭建一个具有多音色控制的文本转语音(TTS)引擎,具体操作步骤如下:

登录高性能应用服务 HAI 控制台

点击 新建 选择 AI 框架,选择算力方案、输入 实例名称、选择数量 后立即购买

开启学术加速功能

完成创建,查看运行状态

进入 jupyter_lab 环境

 

安装 git-lfs:

apt-get clean && apt-get update
apt-get install git-lfs

克隆 EmotiVoice 仓库:

cd /root && git clone https://github.com/netease-youdao/EmotiVoice

下载预训练模型文件:

cd /root/EmotiVoice
git lfs install
git lfs clone https://www.modelscope.cn/syq163/WangZeJun.git


下载 ckpt 模型:

cd /root/EmotiVoice
git lfs clone https://www.modelscope.cn/syq163/outputs.git

安装 EmotiVoice 依赖:

pip install numpy numba scipy transformers==4.26.1 soundfile yacs g2p_en jieba pypinyin


运行 UI 交互界面:

pip install streamlit
cd /root/EmotiVoice && streamlit run demo_page.py --server.port 6889 --logger.level debug

启动命令中的 6889 端口是 高性能应用服务默认开放的端口之一,如果修改了启动命令中的端口,需要手动配置 HAI 的安全组策略,将服务端口放行

运行类 OpenAI TTS 的 API

# 安装ffmpeg
apt-get clean && apt-get update
apt-get install ffmpeg

# 安装API所需的依赖
pip install fastapi
pip install pydub
pip install uvicorn[standard]

# 运行服务
cd /root/EmotiVoice
uvicorn openaiapi:app --reload --host 0.0.0.0 --port 6006

启动后可以通过/docs 查看接口文档

  • 10
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值