语音识别
文章平均质量分 78
yuancoder
这个作者很懒,什么都没留下…
展开
-
走进语音识别中的WFST(二)
这几天生病了,很难受,更新的事情搁置了几天。言归正传,之前建议大家看Mohri的paper因为那是Kaldi官网WFST那一章的作者推荐的,但是现在发现有一本更好的书推荐给大家,这本书深入浅出,讲的更详细,更适合入门的人,尤其是WFST是怎么用在语音识别中的部分讲的特别棒。还有这本书的作者好像是个日本人,所以文笔很适合我们亚洲人的思维。下面是这本书的封面,强力推荐给想入门语音识别解码部分的童鞋。原创 2016-03-14 21:51:44 · 15922 阅读 · 36 评论 -
走进语音识别中的WFST(一)
本人最近在研究语音识别的生成Graph和Lattice的模块,其中用到了WFST这个概念,惊叹于它的神奇也被它的复杂搞得晕头转向。于是决定静下心来仔细研读了Mohri大牛的Speech Recognition with Weighted Finite-state Transducer这篇论文和一些相关资料,算是入门了其中的算法,有些体悟在这里和大家一起探讨,也算是对自己近期学习的一个总结。本系列会先原创 2016-03-13 10:58:27 · 30015 阅读 · 11 评论 -
走进语音识别中的WFST(四)
前一章说了WFST的determinzation这个算法,本章继续说说WFST中的优化操作,包括权重推移(weight pushing)和最小化操作(minimization)。权重推移我们可以这么理解,我们有一双硕大的双手,然后对着WFST的尾巴一用力一推,然后权重就像波浪一样沿着各个路径被推向了前方,自行脑补~效果图如下所示: (注意tropical半环和log半环不太一样)在很多序列识别原创 2016-03-22 20:18:45 · 9007 阅读 · 3 评论 -
走进语音识别中的WFST(三)
下面这几章讲WFST中的优化操作,包括空转移去除(epsilon removal),确定化操作(determinization),权重推移(weight pushing)和最小化操作(minimization)。本章重点介绍空转移去除和确定化操作。epsilon removal是用来去除空转移(WFST中输入标签和输出标签都为空时才算)的操作,如果不进行这一步而直接进行determinzation的原创 2016-03-22 13:38:43 · 9555 阅读 · 10 评论 -
清华大学王东:语音识别中的大数据与小数据学习
原文链接:http://www.199it.com/archives/455137.html本讲座选自清华语音语言实验室副主任王东于2016年1月19日在RONGv2.0系列——”语言语音语义与大数据技术”专场上所做的题为《语音识别中的大数据与小数据学习》的演讲。谢谢大家。刚才刘老师已经把很多的东西说得很清楚了,我觉得我已经可以走了J。但是既然来了,还是转载 2016-04-16 21:43:53 · 8285 阅读 · 0 评论 -
准确率与召回率
在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。准确率、召回率、F1信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(Precision Rate),召回率也叫查全率,准确率也叫查准率,概念公式: 召回率(Recall) =转载 2016-04-17 22:22:32 · 1616 阅读 · 1 评论