VI-SVS 开源项目教程

VI-SVS 开源项目教程

VI-SVS Singing Voice Synthesis based on VITS, different from VISinger VI-SVS 项目地址: https://gitcode.com/gh_mirrors/vi/VI-SVS

1. 项目的目录结构及介绍

VI-SVS/
├── configs/
│   └── singing_base.yaml
├── pitch/
│   └── pitch_extend/
├── resource/
├── svs/
├── util/
│   ├── resample.py
│   ├── generate_label.py
│   └── ...
├── vits/
│   ├── vits_decoder/
│   └── vits_extend/
├── LICENSE
├── README.md
├── pit_export.py
├── pit_train.py
├── svs_export.py
├── svs_infer.py
├── svs_infer.txt
├── svs_infer_pitch.py
├── svs_song.py
├── svs_song.txt
├── svs_song_pitch.py
└── svs_train.py

目录结构介绍

  • configs/: 存放项目的配置文件,如 singing_base.yaml
  • pitch/: 存放与音高相关的文件和扩展。
  • resource/: 存放项目所需的资源文件。
  • svs/: 存放与歌声合成相关的文件。
  • util/: 存放工具脚本,如 resample.py 用于重采样音频文件,generate_label.py 用于生成数据标注。
  • vits/: 存放基于 VITS 模型的相关文件和扩展。
  • LICENSE: 项目的开源许可证文件。
  • README.md: 项目的说明文档。
  • pit_export.py: 用于导出音高模型的脚本。
  • pit_train.py: 用于训练音高模型的脚本。
  • svs_export.py: 用于导出歌声合成模型的脚本。
  • svs_infer.py: 用于推理验证的脚本。
  • svs_infer.txt: 推理验证的配置文件。
  • svs_infer_pitch.py: 使用音高预测进行推理验证的脚本。
  • svs_song.py: 用于完整歌曲合成的脚本。
  • svs_song.txt: 完整歌曲合成的配置文件。
  • svs_song_pitch.py: 使用音高预测进行完整歌曲合成的脚本。
  • svs_train.py: 用于训练歌声合成模型的脚本。

2. 项目的启动文件介绍

训练歌声合成模型

python svs_train.py -c configs/singing_base.yaml -n vits_svs
  • svs_train.py: 启动文件,用于训练歌声合成模型。
  • -c configs/singing_base.yaml: 指定配置文件路径。
  • -n vits_svs: 指定训练的模型名称。

训练音高模型

python pit_train.py -c configs/singing_base.yaml -n pitch
  • pit_train.py: 启动文件,用于训练音高模型。
  • -c configs/singing_base.yaml: 指定配置文件路径。
  • -n pitch: 指定训练的模型名称。

推理验证

python svs_infer.py --config configs/singing_base.yaml --model svs_opencpop.pt
  • svs_infer.py: 启动文件,用于推理验证。
  • --config configs/singing_base.yaml: 指定配置文件路径。
  • --model svs_opencpop.pt: 指定使用的模型文件。

3. 项目的配置文件介绍

configs/singing_base.yaml

# 配置文件示例
model:
  name: vits_svs
  ...

data:
  path: data_svs/
  ...

train:
  batch_size: 32
  ...

infer:
  model_path: svs_opencpop.pt
  ...
  • model: 配置模型的相关参数,如模型名称等。
  • data: 配置数据路径等参数。
  • train: 配置训练相关的参数,如批量大小等。
  • infer: 配置推理验证相关的参数,如模型路径等。

通过以上配置文件,可以灵活调整项目的训练和推理参数,以适应不同的需求和环境。

VI-SVS Singing Voice Synthesis based on VITS, different from VISinger VI-SVS 项目地址: https://gitcode.com/gh_mirrors/vi/VI-SVS

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

解杏茜

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值