语音识别
John_Jiang-
这个作者很懒,什么都没留下…
展开
-
语音识别中的CE准则和MMI准则——内含详细参数更新过程
1.Chain模型综述kaldi中的chain模型是目前kaldi中成功率最高的模型。它实际上是使用LF-MMI,即 LatticeFree-MMI,详见论文 [Purely sequence-trained neural networks for ASR based on lattice-free MMI].(https://www.danielpovey.com/files/2016_int...原创 2019-11-25 17:00:18 · 3394 阅读 · 2 评论 -
FSMN及其变种cFSMN DFSMN pyramidal-FSMN
1.FSMN综述 由于Bi-RNN较高的成功率需要得到整段语音所有未来信息的支持才能实现,因此会带来较长的硬延时,故Bi-RNN不适合作为在线语音识别的模型。故在2015年科大讯飞提出了FSMN(Feedforward Sequential Memory Networks)模型,该模型在很小的延时下,就能取得与Bi-RNN一样的效果。详见论文:...原创 2019-04-30 10:42:10 · 4700 阅读 · 0 评论 -
PyTorch-Kaldi工具箱简介及核心代码注解
pytoch-kaldi简介及核心代码详解。方便大家对该框架进行修改。原创 2019-08-01 22:26:47 · 2741 阅读 · 3 评论 -
PyTorch-Kaldi离线语音识别
用PyTorch-Kaldi做离线语音识别时记录的笔记。原创 2019-08-02 11:16:25 · 2851 阅读 · 5 评论