![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音识别
别水贴了
阿里算法专家。
推荐/搜索算法, NLP,语音识别
展开
-
kaldi 学习笔记-三音素训练1(Decision Tree)
介绍kaldi三音素训练大致流程,本文主要介绍决策树(Decision Tree)部分。原创 2017-09-22 20:19:34 · 5289 阅读 · 1 评论 -
kaldi学习笔记-三音素训练2
本文介绍三音素训练部分。原创 2017-09-23 14:17:52 · 2687 阅读 · 0 评论 -
kaldi 学习笔记-单音素训练
本文介绍kaldi语音识别对单音素训练的大致流程。原创 2017-09-15 22:04:55 · 8504 阅读 · 5 评论 -
语音识别WFST核心算法讲解(1. WFST的基本概念)
本系列主要介绍语音识别WFST中的常用算法, Composition, Determinization, Minimization, Epsilon Removal, Weight Pushing 等。了解这些算法的前提是熟悉WFST基本概念,了解Semiring(半环代数理论), 对图中各类算法(深度优先搜索DFS,最大强连通域SCC)等。因此我们首先介绍WFST的基本概念。伪代码和部分图片...原创 2018-06-22 18:17:38 · 9625 阅读 · 0 评论 -
语音识别WFST核心算法讲解(2. Generic Composition)
本文介绍Composition算法。首先介绍不考虑epsilon的图的composition,然后扩展至含epsilon的,最后对时间复杂度分析,介绍实际工程中openfst和kaldi中的一些优化技巧。 不考虑epsilon的composition算法伪代码如下: 接下来line by line介绍这一算法。首先对于T1, T2两个图,将两者的初始状态合并作为输出结果图的初始状态, ...原创 2018-06-22 20:20:16 · 10774 阅读 · 3 评论 -
语音识别WFST核心算法讲解(3. Determinization)
本文介绍WFST中Determinization这一操作。首先介绍什么是Determinization。 在Openfst官网中介绍如下:The result will be an equivalent FST that has the property that no state has two transitions with the same input label. detemi...原创 2018-06-22 22:55:26 · 3284 阅读 · 0 评论 -
语音识别WFST核心算法讲解(4. Minimization)
本篇讲解Minimization算法。Minimization的作用是用最少的states等效表达原WFST,这样做使WFST的states数目减少,更加紧凑。算法的大体思路是获取WFST图的一个Partition,这个Partition对所有states进行分裂,最终所有等效的states在一个block里作为新的states。每个block含1个或多个states,这样最后minimize...原创 2018-06-25 19:35:31 · 2849 阅读 · 0 评论 -
语音识别WFST-based dynamic decoders
目前语音识别主流是基于WFST解码器,WFST中的优化操作如Determinization,Minimization,Weight Pushing 使得Veterbi解码速度大大加快。 然而实际语音识别的问题还有很多,第一,往往基于静态的HCLG.fst 可能非常大,需要消耗大量内存;第二,静态的HCLG.fst 非常大,一旦语言模型G.fst或者 HMM模型H.fst, Context phon...原创 2018-06-27 21:34:00 · 4580 阅读 · 3 评论