HTK
llearner
这个作者很懒,什么都没留下…
展开
-
HTK语音识别之MFCC参数基本配置参数解释
MFCC基本配置参数解释SOURCEKIND = WAVEFORM -文件种类是语音SOURCEFORMAT = WAV -格式是WAV格式SOURCERATE = 625.0-采样率是16KHZ(16000个采样点/s,1个点是1/160000s=625*100ns,100ns是HTK的时间单位)TARGETKIND=MFCC_E_D_A -目标是MFCC文件,以及energy(原创 2017-04-18 21:30:05 · 2226 阅读 · 0 评论 -
HTK语音识别HResults的结果解释
基本上没有写博客的习惯,之前都是自己在Evernote上记笔记。看了很多牛人的博客,对自己的帮助很大,同时自己也经常忘记一些知识,因此在csdn上尝试记下笔记,希望能够帮助到其他人,也提醒自己一些过往的知识和内容。HTK是语音识别的一个开源工具,能够帮助大家进行ASR的入门。关于安装已经有很多博客都已经写了,因此这里写一点其它的内容。之前有同学对测试结果HResults的输出文本有些不理解。原创 2017-04-06 14:49:03 · 3143 阅读 · 2 评论