语音识别开源软件-- DeepSpeech(2)训练中文数据源thchs30
Thchs30数据源
是清华大学的30小时公用数据集
相关软件安装
-
基本安装: 首先是文档DeepSpeech(1)所提到的安装
见上一篇https://mp.csdn.net/mdeditor/86554065#
-
n-gram处理工具kenlm:
$ git clone https://github.com/kpu/kenlm $sudo apt install zlib1g-dev libbz2-dev liblzma-dev libeigen3-dev libboost1.65-all-dev cmake $mkdir build $cd build $cmake .. $sudo make install
-
安装native_client
这是deepSpeech自带的预处理工具,可以帮助进行预处理
在deepSpeech的根目录中运行:python3 util/taskcluster.py --arch g