语音识别开源软件-- DeepSpeech（2）训练中文数据源thchs30

最新推荐文章于 2024-07-06 10:45:56 发布

VickyG9

最新推荐文章于 2024-07-06 10:45:56 发布

阅读量9.1k

点赞数 2

分类专栏： DeepSpeech 文章标签： DeepSpeech thchs 语音识别

本文链接：https://blog.csdn.net/weixin_36071429/article/details/86594318

版权

本文档详细介绍了如何利用THCHS30数据集训练DeepSpeech的中文语音识别模型。首先，介绍了THCHS30数据集的来源及下载地址，接着讲解了安装相关软件，包括基本安装和n-gram处理工具kenlm的安装。在数据预处理部分，涉及到Alphabet、Vocabulary、CSV、lm.bin和trie的创建。然后，概述了训练模型的步骤，包括编写.sh运行文件和实际运行训练过程。最后，提供了相关参考文档链接供进一步学习。

摘要由CSDN通过智能技术生成

语音识别开源软件-- DeepSpeech（2）训练中文数据源thchs30

Thchs30数据源

是清华大学的30小时公用数据集

下载地址：
http://www.openslr.org/18/

相关软件安装

基本安装： 首先是文档DeepSpeech(1)所提到的安装

见上一篇https://mp.csdn.net/mdeditor/86554065#

n-gram处理工具kenlm：

$ git clone https://github.com/kpu/kenlm   
 $sudo apt install zlib1g-dev libbz2-dev liblzma-dev libeigen3-dev libboost1.65-all-dev cmake
 $mkdir build
 $cd build
 $cmake ..
 $sudo make install

安装native_client
这是deepSpeech自带的预处理工具，可以帮助进行预处理
在deepSpeech的根目录中运行：

python3 util/taskcluster.py --arch g

最低0.47元/天解锁文章

VickyG9

关注

2
点赞
踩
26

收藏

觉得还不错? 一键收藏
7
评论
语音识别开源软件-- DeepSpeech（2）训练中文数据源thchs30

DeepSpeech（2）训练中文数据源thchs30Thchs30数据源是清华大学的30小时公用数据集下载地址：http://www.openslr.org/18/相关软件安装基本安装：首先是文档DeepSpeech(1)所提到的安装见n-gram处理工具kenlm：$ git clone https://github.com/kpu/kenlm $...
复制链接

扫一扫

专栏目录