Tacotron-Wavenet-Vocoder-Korean 项目教程
1. 项目的目录结构及介绍
Tacotron-Wavenet-Vocoder-Korean/
├── data/
│ └── moon/
├── hparams.py
├── README.md
├── requirements.txt
├── synthesizer.py
├── train_tacotron.py
├── train_tacotron2.py
├── train_vocoder.py
└── utils/
data/
: 存放训练数据和测试数据的目录。hparams.py
: 包含项目的超参数配置。README.md
: 项目说明文档。requirements.txt
: 项目依赖的Python包列表。synthesizer.py
: 用于生成语音的脚本。train_tacotron.py
: 用于训练Tacotron模型的脚本。train_tacotron2.py
: 用于训练Tacotron2模型的脚本。train_vocoder.py
: 用于训练Wavenet Vocoder模型的脚本。utils/
: 包含一些辅助功能的脚本。
2. 项目的启动文件介绍
train_tacotron.py
该文件用于训练Tacotron模型。启动命令如下:
python train_tacotron.py train
train_tacotron2.py
该文件用于训练Tacotron2模型。启动命令如下:
python train_tacotron2.py train
train_vocoder.py
该文件用于训练Wavenet Vocoder模型。启动命令如下:
python train_vocoder.py train
synthesizer.py
该文件用于生成语音。启动命令如下:
python synthesizer.py --load_path logdir-tacotron/moon+son_2018-12-25_19-03-21 --num_speakers 2 --speaker_id 0 --text "오스트랄로피테쿠스 아파렌시스는 멸종된 사람족 종으로 현재에는 뼈 화석이 발견되어 있다"
3. 项目的配置文件介绍
hparams.py
该文件包含项目的超参数配置,如模型类型、数据路径、训练参数等。以下是一些关键配置项:
model_type
: 模型类型,可以是'single'或'multi-speaker'。data_paths
: 数据路径,可以是一个或多个数据目录。load_path
: 加载模型的路径,用于继续训练。
示例配置:
parser.add_argument('--data_paths', default='D:\\Tacotron-Wavenet-Vocoder\\data\\moon')
parser.add_argument('--load_path', default='logdir-tacotron/moon+son_2018-12-25_19-03-21')
通过修改这些配置项,可以调整项目的训练和生成行为。