VI-SVS 开源项目教程

最新推荐文章于 2024-09-28 10:15:00 发布

解杏茜

最新推荐文章于 2024-09-28 10:15:00 发布

阅读量1k

点赞数 9

本文链接：https://blog.csdn.net/gitblog_00544/article/details/142196720

版权

VI-SVS 开源项目教程

VI-SVS Singing Voice Synthesis based on VITS, different from VISinger 项目地址: https://gitcode.com/gh_mirrors/vi/VI-SVS

1. 项目的目录结构及介绍

VI-SVS/
├── configs/
│   └── singing_base.yaml
├── pitch/
│   └── pitch_extend/
├── resource/
├── svs/
├── util/
│   ├── resample.py
│   ├── generate_label.py
│   └── ...
├── vits/
│   ├── vits_decoder/
│   └── vits_extend/
├── LICENSE
├── README.md
├── pit_export.py
├── pit_train.py
├── svs_export.py
├── svs_infer.py
├── svs_infer.txt
├── svs_infer_pitch.py
├── svs_song.py
├── svs_song.txt
├── svs_song_pitch.py
└── svs_train.py

目录结构介绍

configs/: 存放项目的配置文件，如 singing_base.yaml。
pitch/: 存放与音高相关的文件和扩展。
resource/: 存放项目所需的资源文件。
svs/: 存放与歌声合成相关的文件。
util/: 存放工具脚本，如 resample.py 用于重采样音频文件，generate_label.py 用于生成数据标注。
vits/: 存放基于 VITS 模型的相关文件和扩展。
LICENSE: 项目的开源许可证文件。
README.md: 项目的说明文档。
pit_export.py: 用于导出音高模型的脚本。
pit_train.py: 用于训练音高模型的脚本。
svs_export.py: 用于导出歌声合成模型的脚本。
svs_infer.py: 用于推理验证的脚本。
svs_infer.txt: 推理验证的配置文件。
svs_infer_pitch.py: 使用音高预测进行推理验证的脚本。
svs_song.py: 用于完整歌曲合成的脚本。
svs_song.txt: 完整歌曲合成的配置文件。
svs_song_pitch.py: 使用音高预测进行完整歌曲合成的脚本。
svs_train.py: 用于训练歌声合成模型的脚本。

2. 项目的启动文件介绍

训练歌声合成模型

python svs_train.py -c configs/singing_base.yaml -n vits_svs

svs_train.py: 启动文件，用于训练歌声合成模型。
-c configs/singing_base.yaml: 指定配置文件路径。
-n vits_svs: 指定训练的模型名称。

训练音高模型

python pit_train.py -c configs/singing_base.yaml -n pitch

pit_train.py: 启动文件，用于训练音高模型。
-c configs/singing_base.yaml: 指定配置文件路径。
-n pitch: 指定训练的模型名称。

推理验证

python svs_infer.py --config configs/singing_base.yaml --model svs_opencpop.pt

svs_infer.py: 启动文件，用于推理验证。
--config configs/singing_base.yaml: 指定配置文件路径。
--model svs_opencpop.pt: 指定使用的模型文件。

3. 项目的配置文件介绍

`configs/singing_base.yaml`

# 配置文件示例
model:
  name: vits_svs
  ...

data:
  path: data_svs/
  ...

train:
  batch_size: 32
  ...

infer:
  model_path: svs_opencpop.pt
  ...

model: 配置模型的相关参数，如模型名称等。
data: 配置数据路径等参数。
train: 配置训练相关的参数，如批量大小等。
infer: 配置推理验证相关的参数，如模型路径等。

通过以上配置文件，可以灵活调整项目的训练和推理参数，以适应不同的需求和环境。

VI-SVS Singing Voice Synthesis based on VITS, different from VISinger 项目地址: https://gitcode.com/gh_mirrors/vi/VI-SVS

解杏茜

关注

9
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫