验证了一个端到端语音识别系统,目前cer结果还不错。考虑怎么实际使用:
1)服务器端: 利用kaldi的流式处理方法(http
1. kaldi-gstreamer-server
GitHub地址是https://github.com/alumae/kaldi-gstreamer-server,里面有详细的安装步骤,步骤分为大的三步
1)安装编译kaldi、安装gstreamer、安装libjansson-dev
2)安装并编译gst-kaldi-nnet2-online,git clone https://github.com/alumae/gst-kaldi-nnet2-online.git
3)安装基于kaldinnet2onlinedecoder解码器的worker, git clone https://github.com/alumae/kaldi-gstreamer-server
2. master_server.py
3. woker.py
4. client.py
rnn 结构
代码:python3.6/site-packages/torch/nn/modules/rnn.py
里面有八个类:
class | 描述 |
---|---|
class RNNBase(Module) | {tanh}(w_{ih} x_t + b_{ih} + w_{hh} h_{(t-1)} |