lucia2meyers-CSDN博客

原创 Kaldi语音识别注意事项

有关语音识别的工作除了Torch，还使用过Kaldi工具箱，也同样整理一下需要注意的细节。参考了thchs30的使用示例。 1. 同样需要注意自己准备的语音数据格式(***.wav等)，声道数，采样频率等属性，采样频率不同需要在自己工程的s5/conf目录下修改mfcc.conf与 fbank.conf文件中的sample-frequency。 2. 并行进程数默认n

2017-10-25 20:27:26 849

原创 Torch+DeepSpeech2的语音识别注意事项

上半年做了一些有关语音识别的工作，整理一下实践过程中容易被忽视的小tricks，以免忘记。本文是在Torch上使用了Baidu的DeepSpeech 2语音识别模型进行的实验。 1. 根据语音数据的格式（如***.wav，单声道等属性），在“MakeLMDB.lua”中将参数进行修改，（将sph格式改为wav，声道数设为1等） 2. 由于自己准备的数据的采样频率sampleRate与预

2017-10-25 19:16:51 4692 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人