23.5k Star！OpenVoice：这款AI工具能够精准模仿你的声音并说出任何语言！-CSDN博客

本文链接：https://blog.csdn.net/lythinking/article/details/138529110

cover_image

23.5k Star！OpenVoice：这款AI工具能够精准模仿你的声音并说出任何语言！

原创 Aitrainee | 公众号：AI进修生：AI算法工程师 / Prompt工程师 / ROS机器人开发者 | 分享AI动态与算法应用资讯，提升技术效率。

排版不佳，公众号阅读原文：23.5k Star！OpenVoice：这款AI工具能够精准模仿你的声音并说出任何语言！

🌟从一小段音频中复制声音并生成多种语言的语音。它不仅支持精准的音色克隆，还可以灵活控制语音风格，如情感和口音，确保声音输出自然流畅。

体验地址：

https://app.myshell.ai/zh/web3/chat

准确的音色克隆

OpenVoice 可以准确克隆参考音色并生成多种语言和口音的语音。

灵活的语音风格控制

OpenVoice 可以对语音风格（例如情感和口音）以及其他风格参数（包括节奏、停顿和语调）进行精细控制。在这里，我们演示了对生成声音的情感和口音的控制。

零样本跨语言语音克隆

参考语音和生成的语音可以是海量说话人多语言数据集之外的任何语言。在下面的例子中，我们使用“U”来表示未见过的语言。

如何使用

以下涉及到的链接 无法跳转 ，请参考如下 原教程文档链接

https://github.com/myshell-ai/OpenVoice/blob/main/docs/USAGE.md

Linux安装

本节仅供熟悉Linux、Python和PyTorch的开发人员和研究人员使用。克隆此存储库，并运行

conda create -n openvoice python=3.9  
conda activate openvoice  
git clone git@github.com:myshell-ai/OpenVoice.git  
cd OpenVoice  
pip install -e .

无论您使用V1还是V2，上述安装过程都是相同的。

OpenVoice V1

从这里下载检查点，并将其解压缩到 checkpoints 文件夹中。

1. 灵活的语音风格控制。 请参阅 demo_part1.ipynb
以了解OpenVoice如何实现对克隆声音的灵活风格控制的示例用法。

2. 跨语言语音克隆。 请参阅 demo_part2.ipynb 以了解在MSML训练集中看到或未看到的语言的示例。

3. Gradio演示。 我们在这里提供了一个简约的本地gradio演示。如果用户在使用gradio演示时遇到问题，我们强烈建议用户查看 demo_part1.ipynb 、 demo_part2.ipynb 和 QnA 。使用 python -m openvoice_app --share 启动本地gradio演示。

OpenVoice V2

从这里下载检查点，并将其解压缩到 checkpoints_v2 文件夹中。

安装 MeloTTS ：

pip install git+https://github.com/myshell-ai/MeloTTS.git  
python -m unidic download

演示用法。 请参阅 demo_part3.ipynb 以了解OpenVoice
V2的示例用法。现在它原生支持英语、西班牙语、法语、中文、日语和韩语。

23.5k Star！OpenVoice：这款AI工具能够精准模仿你的声音并说出任何语言！

23.5k Star！OpenVoice：这款AI工具能够精准模仿你的声音并说出任何语言！

准确的音色克隆

灵活的语音风格控制

零样本跨语言语音克隆

如何使用

Linux安装

OpenVoice V1

OpenVoice V2

更多配音相关