GPT-SoVITS 是一个开源的声音克隆项目,可以训练自己的声音模型。
效果非常好,使用超级简单。
如果你有声音克隆的需求,必须要试试这个项目。
不说废话,直接看怎么训练自己的声音模型。
1. 安装
我的是Windows系统,GPT-SoVITS 为 Windows 提供了整合包。
地址:
https://huggingface.co/lj1995/GPT-SoVITS-windows-package/resolve/main/GPT-SoVITS-beta.7z?download=true
下载解压后直接运行其中的 go-webui.bat
即可。
如果你的Linux或者Mac,请参考项目说明。
2. 训练声音模型
模型训练的流程:
1)人声伴奏分离
如果你提供的音频是干净的人声,就略过此步骤。
2)语音切分
把提供的语音切分成N个几秒的小段儿音频。
3)语音识别 ASR
把每段音频中的文字提取出来。
4)语音文本校对
纠正上一步提取出来的文字不准确的地方,修正。
5)训练集格式化
处理校对过的文本,特征提取,语义token提取。
6)声音模型训练</