VI-SVS 开源项目教程
1. 项目的目录结构及介绍
VI-SVS/
├── configs/
│ └── singing_base.yaml
├── pitch/
│ └── pitch_extend/
├── resource/
├── svs/
├── util/
│ ├── resample.py
│ ├── generate_label.py
│ └── ...
├── vits/
│ ├── vits_decoder/
│ └── vits_extend/
├── LICENSE
├── README.md
├── pit_export.py
├── pit_train.py
├── svs_export.py
├── svs_infer.py
├── svs_infer.txt
├── svs_infer_pitch.py
├── svs_song.py
├── svs_song.txt
├── svs_song_pitch.py
└── svs_train.py
目录结构介绍
- configs/: 存放项目的配置文件,如
singing_base.yaml
。 - pitch/: 存放与音高相关的文件和扩展。
- resource/: 存放项目所需的资源文件。
- svs/: 存放与歌声合成相关的文件。
- util/: 存放工具脚本,如
resample.py
用于重采样音频文件,generate_label.py
用于生成数据标注。 - vits/: 存放基于 VITS 模型的相关文件和扩展。
- LICENSE: 项目的开源许可证文件。
- README.md: 项目的说明文档。
- pit_export.py: 用于导出音高模型的脚本。
- pit_train.py: 用于训练音高模型的脚本。
- svs_export.py: 用于导出歌声合成模型的脚本。
- svs_infer.py: 用于推理验证的脚本。
- svs_infer.txt: 推理验证的配置文件。
- svs_infer_pitch.py: 使用音高预测进行推理验证的脚本。
- svs_song.py: 用于完整歌曲合成的脚本。
- svs_song.txt: 完整歌曲合成的配置文件。
- svs_song_pitch.py: 使用音高预测进行完整歌曲合成的脚本。
- svs_train.py: 用于训练歌声合成模型的脚本。
2. 项目的启动文件介绍
训练歌声合成模型
python svs_train.py -c configs/singing_base.yaml -n vits_svs
- svs_train.py: 启动文件,用于训练歌声合成模型。
- -c configs/singing_base.yaml: 指定配置文件路径。
- -n vits_svs: 指定训练的模型名称。
训练音高模型
python pit_train.py -c configs/singing_base.yaml -n pitch
- pit_train.py: 启动文件,用于训练音高模型。
- -c configs/singing_base.yaml: 指定配置文件路径。
- -n pitch: 指定训练的模型名称。
推理验证
python svs_infer.py --config configs/singing_base.yaml --model svs_opencpop.pt
- svs_infer.py: 启动文件,用于推理验证。
- --config configs/singing_base.yaml: 指定配置文件路径。
- --model svs_opencpop.pt: 指定使用的模型文件。
3. 项目的配置文件介绍
configs/singing_base.yaml
# 配置文件示例
model:
name: vits_svs
...
data:
path: data_svs/
...
train:
batch_size: 32
...
infer:
model_path: svs_opencpop.pt
...
- model: 配置模型的相关参数,如模型名称等。
- data: 配置数据路径等参数。
- train: 配置训练相关的参数,如批量大小等。
- infer: 配置推理验证相关的参数,如模型路径等。
通过以上配置文件,可以灵活调整项目的训练和推理参数,以适应不同的需求和环境。