ASRT语音识别系统的部署以及模型训练(模型训练篇)

本文详述了ASRT语音识别系统在Windows上的部署和模型训练过程,包括CUDA和cuDNN的安装,Anaconda环境配置,数据集下载与解压,配置文件修改,模型训练参数调整以及模型训练与评估。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ASRT语音识别系统的部署以及模型训练(模型训练篇)


前言

ASRT是一个中文语音识别系统,由AI柠檬博主开源在GitHub上。

GitHub地址:ASRT_SpeechRecognition

国内Gitee镜像地址:ASRT_SpeechRecognition

文档地址:ASRT语音识别工具文档

本文主要是记录一下我在参考文章:教你如何使用ASRT训练中文语音识别模型 并完成部署和训练过程中的操作步骤。文章作者比较惜字如金,文中很多细节之处没有细讲,我在windows上进行部署的时候踩了比较多的坑,特此记录下。

本文适用对象:想要训练自己的语音识别模型(如:训练出可识别某些方言的模型)以搭建一个能够进行满足自定义需求的语音识别服务端。


先决条件

众所周知,跑神经网络,要用到英伟达的显卡。

本人硬件参数:

以下是官方配置建议,我的显卡肯定不达标,但我想着最多训练久一点[捂脸]。

Graphical user interface, text, application, email Description automatically generated

下载源代码

按照如图所示步骤即可直接下载最新源代码压缩包。

下载完成后,需要进行解压。之后,如果GitHub仓库上如果代码有更新,重复上述步骤即可。

我的解压路径:

cd C:\Users\Administrator\Documents\ftp\qianyuhui\src\ASRT_SpeechRecognition

操作系统安装CUDA、cuDNN

训练模型请安装好Nvidia GPU驱动和CUDA、cuDNN。

安装步骤

安装过程略过。参考文章:Windows 安装 CUDA/cuDNN

查看CUDA版本

nvcc -V

查看cuDNN版本

进入 cuda 的安装路径, C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\include,找到 cudnn_version.h 选中,以记事本方式打开。

这里,我的是8.8.1

安装Anaconda

安装步骤

安装步骤略过,参考文章:anaconda的安装和使用

查看conda版本信息

Anaconda PowerShell控制台中输入以下命令:

conda info

我的conda版本是23.1.0

conda创建python虚拟环境

首先请确保Anaconda 创建python3.10的虚拟环境。

操作步骤

我给asrt单独创建了一个名为:asrt_env的虚拟环境:

Anaconda PowerShell控制台中输入以下命令:

conda create -n asrt_env python=3.10 

查看虚拟环境基本信息

Anaconda PowerShell</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

切糕师学AI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值