- 博客(2)
- 收藏
- 关注
原创 Kaldi语音识别注意事项
有关语音识别的工作除了Torch,还使用过Kaldi工具箱,也同样整理一下需要注意的细节。参考了thchs30的使用示例。 1. 同样需要注意自己准备的语音数据格式(***.wav等),声道数,采样频率等属性,采样频率不同需要在自己工程的s5/conf目录下修改mfcc.conf与 fbank.conf文件中的sample-frequency。 2. 并行进程数默认n
2017-10-25 20:27:26 849
原创 Torch+DeepSpeech2的语音识别注意事项
上半年做了一些有关语音识别的工作,整理一下实践过程中容易被忽视的小tricks,以免忘记。本文是在Torch上使用了Baidu的DeepSpeech 2语音识别模型进行的实验。 1. 根据语音数据的格式(如***.wav,单声道等属性),在“MakeLMDB.lua”中将参数进行修改,(将sph格式改为wav,声道数设为1等) 2. 由于自己准备的数据的采样频率sampleRate与预
2017-10-25 19:16:51 4692 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人