今天主要是学习一些基本知识,上网逛了一圈,发现一些有价值的资料,其中包括这些内容:
1、语音识别系统的基本任务就是将输入的语音信号,识别成文字符号输出,基本流程如下图所示,基本上分成两个部分:前端处理(Front End Processing, FE)、搜索和解码(Search and Decoding)。其中,搜索和解码需要利用训练好的声学模型(Acoustic Model,AM)、语言模型(Language Model, LM),以及联系这两个模型的发音词典(Lexicon)。(摘自:《语音识别入门(V1.0)》)
2、语音识别技术研究目前以CUED最为开放和活跃,其工具包HTK和相关研究组的网址如下,通过这些网址可以链接到上述语音识别相关的网站。
http://htk.eng.cam.ac.uk/
http://mi.eng.cam.ac.uk/research/speech/
3、HTK是由剑桥大学电机系研发的隐藏式马尔可夫模型(HMM)分析工具,使用它可以快速的开发出一套基于HMM的语音识别系统。
参考的资料是:
《语音识别入门(V1.0)》(中科院自动化所)