EmotiVoice 开源 TTS 引擎使用教程

最新推荐文章于 2025-05-04 14:15:07 发布

翁冰旭

最新推荐文章于 2025-05-04 14:15:07 发布

阅读量1.5k

点赞数 17

本文链接：https://blog.csdn.net/gitblog_00385/article/details/141010234

版权

EmotiVoice 开源 TTS 引擎使用教程

EmotiVoiceEmotiVoice 😊: a Multi-Voice and Prompt-Controlled TTS Engine项目地址:https://gitcode.com/gh_mirrors/em/EmotiVoice

项目介绍

EmotiVoice（易魔声）是一个强大的开源 TTS 引擎，支持中英文双语，包含 2000 多种不同的音色以及特色的情感合成功能。它支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。EmotiVoice 提供一个易于使用的 web 界面，还有用于批量生成结果的脚本接口。

项目快速启动

环境准备

首先，确保你的机器上安装了 Docker 和 NVidia 容器工具包。如果你还没有安装，可以按照以下步骤进行安装：

安装 Docker：

sudo apt-get update
sudo apt-get install docker.io

安装 NVidia 容器工具包：

distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker

运行 EmotiVoice

使用以下命令拉取并运行 EmotiVoice 的 Docker 镜像：

docker pull syq163/emoti-voice:latest
docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest

打开浏览器并导航到 http://localhost:8501，即可开始使用 EmotiVoice 的强大 TTS 功能。

应用案例和最佳实践

情感合成示例

EmotiVoice 的情感合成功能可以用于创建具有不同情感的语音，例如：

快乐：用于游戏中的角色对话或积极的用户反馈。
悲伤：用于讲述悲伤的故事或表达同情。
愤怒：用于角色扮演游戏中的敌对角色或紧急通知。

批量生成语音

使用脚本接口可以批量生成语音文件，适用于需要大量语音数据的场景，如语音导航、有声书等。

import requests

url = "http://localhost:8501/tts"
payload = {
    "text": "这是一个测试文本",
    "voice": "zh-CN-XiaoxiaoNeural",
    "emotion": "happy"
}
response = requests.post(url, json=payload)
with open("output.wav", "wb") as f:
    f.write(response.content)