ASRT语音识别系统的部署以及模型训练(模型训练篇)

切糕师学AI

已于 2023-05-30 08:30:58 修改

阅读量2.1k

点赞数

分类专栏： # 语音识别asr与语音合成STT 文章标签：语音识别人工智能

于 2023-04-17 15:30:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guigenyi/article/details/130201070

版权

本文详述了ASRT语音识别系统在Windows上的部署和模型训练过程，包括CUDA和cuDNN的安装，Anaconda环境配置，数据集下载与解压，配置文件修改，模型训练参数调整以及模型训练与评估。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

ASRT语音识别系统的部署以及模型训练(模型训练篇)

前言

ASRT是一个中文语音识别系统，由AI柠檬博主开源在GitHub上。

GitHub地址：ASRT_SpeechRecognition

国内Gitee镜像地址：ASRT_SpeechRecognition

文档地址：ASRT语音识别工具文档

本文主要是记录一下我在参考文章：教你如何使用ASRT训练中文语音识别模型并完成部署和训练过程中的操作步骤。文章作者比较惜字如金，文中很多细节之处没有细讲，我在windows上进行部署的时候踩了比较多的坑，特此记录下。

本文适用对象：想要训练自己的语音识别模型（如：训练出可识别某些方言的模型）以搭建一个能够进行满足自定义需求的语音识别服务端。

文章目录

前言

@[toc]

先决条件

下载源代码

操作系统安装CUDA、cuDNN

安装步骤

查看CUDA版本

查看cuDNN版本

安装Anaconda

安装步骤

查看conda版本信息

conda创建python虚拟环境

操作步骤

查看虚拟环境基本信息

为ASRT项目安装依赖包

安装依赖包

踩坑记录

模型训练

下载数据集

下载数据集目录

下载数据集

(1) 下载

(2) 解压

a. 整体批量解压

b. 继续解压aidatatang_200zh

c. 继续解压data_aishell

d. magicdata数据集的单独处理操作

修改配置文件

构建目录与数据集文件的关联

(1) 相对路径的写法：

(2) 绝对路径的写法：

模型训练参数调整：

训练模型

评估模型准确率

语音识别测试

常见问题去哪里找？

先决条件

众所周知，跑神经网络，要用到英伟达的显卡。

本人硬件参数：

以下是官方配置建议，我的显卡肯定不达标，但我想着最多训练久一点[捂脸]。

Graphical user interface, text, application, email Description automatically generated

下载源代码

按照如图所示步骤即可直接下载最新源代码压缩包。

下载完成后，需要进行解压。之后，如果GitHub仓库上如果代码有更新，重复上述步骤即可。

我的解压路径：

cd C:\Users\Administrator\Documents\ftp\qianyuhui\src\ASRT_SpeechRecognition

操作系统安装CUDA、cuDNN

训练模型请安装好Nvidia GPU驱动和CUDA、cuDNN。

安装步骤

安装过程略过。参考文章：Windows 安装 CUDA/cuDNN

查看CUDA版本

nvcc -V

查看cuDNN版本

进入 cuda 的安装路径， C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\include，找到 cudnn_version.h 选中，以记事本方式打开。

这里，我的是8.8.1

安装Anaconda

安装步骤

安装步骤略过，参考文章：anaconda的安装和使用

查看conda版本信息

Anaconda PowerShell控制台中输入以下命令：

conda info

我的conda版本是23.1.0

conda创建python虚拟环境

首先请确保Anaconda 创建python3.10的虚拟环境。

操作步骤

我给asrt单独创建了一个名为：asrt_env的虚拟环境：

Anaconda PowerShell控制台中输入以下命令：

conda create -n asrt_env python=3.10

查看虚拟环境基本信息

Anaconda PowerShell</

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

切糕师学AI 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。