asr
文章平均质量分 84
艾鹤
敏于行,敏于言,千里之行始于足下。
展开
-
汉明窗试分析
I、预备知识:1)帧:简单说,有一段语音信号,分成很小的一段一段的等长的信号,这其中一段就是一帧。—通常一秒取约33帧到100帧,也就是说一帧大约时长为1s/100-1s/33。(如下图为一段语音数字信号) 2)信号预处理:在对一段语音数字信号进行预加重数字滤波处理后,紧接着需要将信号分成一帧一帧,为了保证帧与帧之间平滑过渡,往往允许帧与帧之间有重合,(如下图所示) 分原创 2017-07-15 22:21:01 · 8161 阅读 · 0 评论 -
掩蔽效应
I、预备知识1,振幅 影响响度,振幅越大,响度越大,反之亦然。2,频率 影响音调,频率越大,音调越高,反之亦然。II、定义:1)从振幅的角度来说,响度大的声音会遮住响度小的声音;2)从频率的角度来说,音调低的声音会遮住音调高的声音;以上描述中,关于生硬的遮蔽特点称之为掩蔽效应。原创 2017-07-15 18:32:29 · 886 阅读 · 0 评论 -
语音识别原理--理论基础(一)
识别过程很重要的理论知识: 1、MFCC、GMM、NN 2、HMM、decision tree、viterbi参考资料强推: 1)Speech and Language Processing 2nd edition (第四章、第六章、第九章)(中文翻译,博客参见:http://blog.csdn.net/quhediegooo/article/details/56677147系列) 2)S原创 2017-11-08 20:58:33 · 1117 阅读 · 2 评论 -
kaldi安装(Ubuntu)
安装步骤 ,如下:第一步、下载好kaldi后,解压,进入tools/,打开INSTALL文件,这里面有如下的安装教程(省略了一万个字):...CXX=g++-4.8 extras/check_dependencies.sh...Then run...make CXX=g++-4.8...方法一:说到底就是gcc版本可能不对,所以g++4.8以下的升级下,然后,安装命令如...原创 2017-12-06 11:26:37 · 647 阅读 · 1 评论