2013年12月_零落_World

12月

原创 HTK搭建大词汇量连续语音识别系统（五）

混合高斯模型+语言模型今天事情比较多，就花了点时间看了一下HTKbook的高斯混合模型和data driven，然后使用HVite进行解码，时间比较长，出去吃了个饭，打几局台球回来刚好运行完。 1、初始proto 的hmm模型： ~o 39 ~h "proto1" 39 5 2 5 1 0.2 39 0.0 0.0 0.0 0.0

2013-12-31 21:49:41 2757 1

原创 HTK搭建大词汇量连续语音识别系统（四）

语言学模型训练（1）数据准备使用HTK自带脚本LCond.pl生成分词后的文本语料命令：perl scripts/LCond.pl sentence>trainlanguage 其中sentence是之前的trainprompts去掉路径的句子，生成的language如下： SHE HAD YOUR DARK SUIT IN GREASY WASH WATER ALL YEAR

2013-12-29 20:42:57 3471 3

原创 HTK搭建大词汇量连续语音识别系统（三）

十、绑定三音素脚本mktri.led： WB sp WB sil TC 执行命令: HLEd -n labels/triphones1 -i labels/wintry.mlf scripts/mktri.led labels/aligned.mlf 脚本mktri.hed由脚本命令生成： perl scripts/maketrihed data/monophones1 la

2013-12-28 20:57:29 4420 8

原创 HTK搭建大词汇量连续语音识别系统（二）

接着昨天的做。昨天有个没注意的地方需要改过来，timit发音文件每个发音最后不能有sp，否则dict1会有两个sp。六、提取特征参数，生成.mfc文件编写配置文件wav_config，内容如下： SOURCEFORMAT=NIST TARGETKIND=MFCC_0_D_A TARGETRATE=100000.0 SAVECOMPRESSED=T USEHAM

2013-12-27 21:41:51 6454 7

原创 HTK搭建大词汇量连续语音识别系统(一)

使用HTK搭建大词汇量语音识别系统，采用的是timit语音库，由于timit语音库的文本语料全是小写，为了与HTKbook中的例子一致，我用python对所有单词和句子都转换成了大写。一、建立任务语法，建立gram 由于timit语音库自带文件中没有HTK能直接使用的任务语法，故我将timit中的发音文件timitdic.txt使用python转换成了任务语法。Python脚本

2013-12-26 21:44:52 8779 4

原创 Linux下安装测试HTK

1. 安装g++ 和libx11 命令： sudo apt-get install g++ gcc sudo apt-get install libx11-dev 2. 解压HTK-3.4.1.tar.gz并安装命令： sudo tar xzf HTK-3.4.1.tar.gz cd htk sudo ./configure --prefix=/usr/local/ su

2013-12-24 10:28:23 2280

原创 HTK孤立词语音识别小系统

我主要参考两篇博客搭建起这个语音识别系统的：http://my.oschina.net/jamesju/blog/116151 http://www.cnblogs.com/mingzhao810/archive/2012/08/03/2617674.html 感谢两位博主的无私奉献。我实现的是6个单词的识别，即：hello, world, port, star

2013-12-23 14:39:08 5745 2

原创 UNIX环境高级编程——第一个程序

开始接触Linux了，在网上查了一大堆资料，都说《Unix环境高级编程》是Linux界的“圣经”，那我就从这本书开始学吧。该书的第一个程序即shell ls的实现就把我给难住了，因为头文件“apue.h”放在/usr/include/中还是会出错，在网上查了查资料，方法很麻烦，看着头晕，我这人就是有这毛病，怕麻烦。不过还好，找到一篇文章提供了一个简单方法，但是据说有个别的程序会出现

2013-12-04 14:52:58 1110 2