DiffWave-SaShiMi 项目使用教程
1. 项目目录结构及介绍
diffwave-sashimi/
├── configs/
│ ├── config.yaml
│ └── ...
├── exp/
│ └── ...
├── samples/
│ └── ...
├── train.py
├── README.md
└── ...
- configs/: 存放项目的配置文件,包括默认配置和其他自定义配置。
- exp/: 存放实验结果和训练日志。
- samples/: 存放生成的音频样本。
- train.py: 项目的启动文件,用于训练模型。
- README.md: 项目的说明文档,包含项目的基本信息和使用方法。
2. 项目的启动文件介绍
train.py
train.py
是项目的启动文件,用于训练 DiffWave 和 SaShiMi 音频生成模型。通过运行该脚本,可以启动模型的训练过程。
python train.py
默认情况下,该脚本会使用 configs/config.yaml
中的配置进行训练。可以通过命令行参数覆盖默认配置,例如:
python train.py model=sashimi train.ckpt_iter=-1
3. 项目的配置文件介绍
configs/config.yaml
config.yaml
是项目的主要配置文件,定义了训练过程中使用的各种参数,包括模型类型、训练数据路径、学习率等。
model: sashimi
train:
ckpt_iter: -1
learning_rate: 1e-4
...
- model: 指定使用的模型类型,例如
sashimi
或diffwave
。 - train.ckpt_iter: 指定从哪个检查点恢复训练,
-1
表示从头开始训练。 - train.learning_rate: 设置训练过程中的学习率。
通过修改 config.yaml
文件中的参数,可以自定义训练过程。此外,项目还支持通过命令行参数动态修改配置,具体用法可以参考 README.md
文件中的说明。