Wespeaker框架训练（2）

最新推荐文章于 2025-05-14 12:20:32 发布

shadowismine

最新推荐文章于 2025-05-14 12:20:32 发布

阅读量518

点赞数

分类专栏：语音识别文章标签： linux 运维服务器

本文链接：https://blog.csdn.net/shadowismine/article/details/133295037

版权

11 篇文章

订阅专栏

本文详细描述了在Wespeaker环境中使用Python脚本train.py进行模型训练的过程，涉及数据预处理、GPU分配、torchrun命令以及config.yaml和run.sh脚本的参数设置。训练过程中输出了epoch、loss和accuracy信息。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

2. 模型训练

数据集处理完毕后开始训练，主要是调用wespeaker/bin/train.py 函数

echo ”Start training ...” 打印提示信息，表示开始训练
num_gpus=$(echo $gpus | awk -F ’,’ ’print NF’) 通过gpus 变量获取要使用的GPU 数量
torchrun –standalone –nnodes=1 –nproc_per_node=$num_gpus，其中使用torchrun 命令来运行训练脚本
- standalone 表示以独立模式运行
- nnodes=1 表示使用单节点
- nproc_per_node=$num_gpus 表示每个节点使用$num_gpus 个进程
wespeaker/bin/train.py

在train.py中

输入参数：包括conf\config.yaml文件，也可以是外部设定的参数内容（如run.sh中定义外部参数config = conf/campplus.yaml）

campplus.yaml文件中又对训练epoch，间隔，保存记录，输出路径等参数进行了设定。具体后续对模型训练参数修改就在具体的模型.yaml文件中进行设定。临时的修改可以在run.sh中进行修改。

首先设置run.sh 起始stage 和结束stage都为3；

通过anaconda进入wespeaker 环境(这里环境名称就是Wespeaker)

conda activate Wespeaker

运行nohup bash run.sh > ./exp/firstmodel.log 2>&1 &
进入训练阶段。

输出队列内容如下：