如何下载并使用HTK工具包

鸟听风啸

于 2020-12-20 22:53:57 发布

阅读量1.1k

点赞数

分类专栏：语音识别学习文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42637916/article/details/111464399

版权

语音识别学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

HTK是用来进行自动语音识别研究的工具包，它由剑桥大学工程系的机器智能实验室开发的开源软件，全称叫做The HiddenMarkov Toolkit。官方网站：http://htk.eng.cam.ac.uk

这个工具包必须安装VS后才能使用。因为它是基于C进行开发的。HTK工具包的安装需要配置一个VS的环境变量。值得一提的是，我们现在能安装的VS版本中的环境变量路径与HTK工具包中提示的路径大不一样了。像本人安装的VS2017版本的所使用的环境变量为 D:\Microsoft Visual Studio\2017\Community\VC\Auxiliary\Build。

HTK工具包的安装需要在官网注册后才能下载。解压后，根据HTK自带的README,大家可以按照步骤自行安装。（注：需要在htk文件下的cmd窗口进行操作）

HTK工具包主要有以下几个功能：

HSLab.exe 录音，标记工具

Hcopy.exe 从语音提取特征参数的工具

HInit.exe 和 HCompV.exe 对HMM模型初始化的工具，注意，这里需要对每个模型都要使用此命令进行初始化

HRest.exe 对模型进行迭代训练的工具

HParse.exe 语法转网络的工具，发音转本文用到的。

HSGen.exe 语法查错工具

HVite.exe 解码工具，也就是识别工具。可以用命令行方式使用，也可以用交互方式使用。

当安装完成后，该如何使用这个工具包呢？笔者以接下来的实验中所用到的提取MFCC特征举例。首先需要新建一个文件夹，然后在复制Hcopy.exe到该文件下，然后需要配置两个文件list.scp和tr_wav.cfg。整体框架如下：

list.scp文件中写入待提取的WAV文件名与提取MFCC特征后的,mfc文件名。

tr_wav.cfg文件存入提取MFCC特征的参数。

#[MODULE] PARAMETER = VALUE

SOURCEKIND = WAVEFORM

SOURCEFORMAT = WAV

ZMEANSOURCE = F #

TARGETKIND = MFCC_E_D_A_Z

TARGETRATE = 100000.0 # frame period = 10msec

SAVECOMPRESSSED = T

SAVEWITHCRC = T

WINDOWSIZE = 250000.0 # window size = 25msec

USEHAMMING = T

PREEMCOEF = 0.97 # 1st order preemphasis, coefficient = 0.97

NUMCHANS = 26 # num. of filterbank channel = 26

CEPLIFTER = 22 # num. of cepstra = 22

NUMCEPS = 12 # num. of MFCC coefficient = 12

ENORMALIZE = T # energy normalization (live: F, otherwise: T)

ALLOWXWRDEXP = T # Needed for cross word systems

FORCECXTEXP = T # Needed for cross word systems

#HSHELL Parameters

HSHELL: TRACE = 0002 # cotal

#HPARM Parameters

HPARM: TRACE = 0101

#HLABEL Parameters

HLABEL: TRACE = 0010

#HNET Parameters

HNET: TRACE = 0001 # Needed for recognition

#HREc Parameters

HREC: FORCEOUT = T

在这个文件夹下打开cmd，运行 hcopy -A -D -T 1 -C tr_wav.cfg -S .\list.scp ，即可提取出所需要.mfc文件。

成功的标志如下图所示：

参考博客：

1.https://blog.csdn.net/qq_36444303/article/details/100164507?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control

2.https://blog.csdn.net/jojozhangju/article/details/18714961

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。