- 博客(8)
- 资源 (28)
- 收藏
- 关注
原创 HTK搭建大词汇量连续语音识别系统( 五)
混合高斯模型+语言模型 今天事情比较多,就花了点时间看了一下HTKbook的高斯混合模型和data driven,然后使用HVite进行解码,时间比较长,出去吃了个饭,打几局台球回来刚好运行完。 1、初始proto 的hmm模型: ~o 39 ~h "proto1" 39 5 2 5 1 0.2 39 0.0 0.0 0.0 0.0
2013-12-31 21:49:41 2757 1
原创 HTK搭建大词汇量连续语音识别系统(四)
语言学模型训练 (1)数据准备 使用HTK自带脚本LCond.pl生成分词后的文本语料 命令:perl scripts/LCond.pl sentence>trainlanguage 其中sentence是之前的trainprompts去掉路径的句子,生成的language如下: SHE HAD YOUR DARK SUIT IN GREASY WASH WATER ALL YEAR
2013-12-29 20:42:57 3471 3
原创 HTK搭建大词汇量连续语音识别系统(三)
十、绑定三音素 脚本mktri.led: WB sp WB sil TC 执行命令: HLEd -n labels/triphones1 -i labels/wintry.mlf scripts/mktri.led labels/aligned.mlf 脚本mktri.hed由脚本命令生成: perl scripts/maketrihed data/monophones1 la
2013-12-28 20:57:29 4420 8
原创 HTK搭建大词汇量连续语音识别系统(二)
接着昨天的做。昨天有个没注意的地方需要改过来,timit发音文件每个发音最后不能有sp,否则dict1会有两个sp。 六、提取特征参数,生成.mfc文件 编写配置文件wav_config,内容如下: SOURCEFORMAT=NIST TARGETKIND=MFCC_0_D_A TARGETRATE=100000.0 SAVECOMPRESSED=T USEHAM
2013-12-27 21:41:51 6454 7
原创 HTK搭建大词汇量连续语音识别系统(一)
使用HTK搭建大词汇量语音识别系统,采用的是timit语音库,由于timit语音库的文本语料全是小写,为了与HTKbook中的例子一致,我用python对所有单词和句子都转换成了大写。 一、建立任务语法,建立gram 由于timit语音库自带文件中没有HTK能直接使用的任务语法,故我将timit中的发音文件timitdic.txt使用python转换成了任务语法。Python脚本
2013-12-26 21:44:52 8779 4
原创 Linux下安装测试HTK
1. 安装g++ 和libx11 命令: sudo apt-get install g++ gcc sudo apt-get install libx11-dev 2. 解压HTK-3.4.1.tar.gz并安装 命令: sudo tar xzf HTK-3.4.1.tar.gz cd htk sudo ./configure --prefix=/usr/local/ su
2013-12-24 10:28:23 2280
原创 HTK孤立词语音识别小系统
我主要参考两篇博客搭建起这个语音识别系统的:http://my.oschina.net/jamesju/blog/116151 http://www.cnblogs.com/mingzhao810/archive/2012/08/03/2617674.html 感谢两位博主的无私奉献。 我实现的是6个单词的识别,即:hello, world, port, star
2013-12-23 14:39:08 5745 2
原创 UNIX环境高级编程——第一个程序
开始接触Linux了,在网上查了一大堆资料,都说《Unix环境高级编程》是Linux界的“圣经”,那我就从这本书开始学吧。 该书的第一个程序即shell ls的实现就把我给难住了,因为头文件“apue.h”放在/usr/include/中还是会出错,在网上查了查资料,方法很麻烦,看着头晕,我这人就是有这毛病,怕麻烦。不过还好,找到一篇文章提供了一个简单方法,但是据说有个别的程序会出现
2013-12-04 14:52:58 1110 2
HTK孤立词语音识别系统所有文件
2013-12-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人