![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
WFST
文章平均质量分 70
郑郑yay
这个作者很懒,什么都没留下…
展开
-
个性化语言模型的高效动态WFST解码
摘要: 我们提出了一种两层缓存机制来加速个性化语言模型下的动态WFST解码。第一层是一个公共缓存,它存储图形的大部分静态部分。这在所有用户中是全局共享的。第二层是私有缓存,用于缓存表示个性化语言模型的图形,该模型仅由特定用户的话语共享。我们还提出了两种简单而有效的预初始化方法,一种是基于广度优先搜索的方法,另一种是基于数据驱动的方法,利用先前的语句来探索解码器的状态。通过一个使用个性化联系人列表的呼叫语音识别任务的实验表明,与不进行预初始化的解码相比,所提出的公共缓存将解码时间缩短了三倍。使用私有缓存可提原创 2021-03-21 23:04:12 · 399 阅读 · 0 评论 -
Rescoring
思路: 使用小的构建,然后使用来构建静态图,然后使用小的和大的来构建(中的权重为的权重减去的权重)解码时根据和的使用方式,又可以细分: 常规的Rescoring:利用先全部解码,生成词图或者N-best,然后在上做词图和N-best的Rescoring on-the-fly Rescoring:使用做解码,在解码过程中,每当解码出的word时,立即加上中权重,完成实时的Rescoring。 ...原创 2021-03-11 22:09:23 · 175 阅读 · 0 评论 -
Dynamic Decoders with On-the-fly WFST Operations(动态解码器与动态WFST操作)
前言 导师让搞语音识别的后端处理技术,就是关于解码方面的,但是现在很迷茫,就打算从最基本的动态解码处理开始,由于静态解码好多博主都已经写过了,由自己开始读关于动态解码部分,所以开始自己记录自己学习的过程,希望能够坚持下来。 首先来说明WFST静态解码相比于传统的方法有哪些问题, 一是识别网络内存消耗大,识别网络通常是WFST形式的大型静态网络。 另一个是组合和优化的WFST的在线操作的计算成本。换句话说,当我们修改一个知识源时,即使是一个小的修改,例如在词汇表中增加一个新单词,我们也必须重构整个识别网原创 2021-02-02 18:58:36 · 419 阅读 · 1 评论