语音识别:
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。它主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别区别于声纹识别,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的发展可参考http://baike.baidu.com/view/652891.htm。
以下主要介绍PC端语音识别产品,现行产品还是分为两种:云语音识别和离线语音识别。
云语音识别:
1. html5语音输入标签直接支持语音输入,浏览器中的语音输入,未来语音识别的标准,由于是基于Google的语音库的,因此识别率还较低,需要浏览器支持(目前chrome 11及以上版本支持较好,IE和Firefox等暂不支持),实例:WebQQ中在chrome中打开有使用该语音识别 http://web.qq.com/
2. PC端的google输入法语音输入,这个和应该和chrome中的类似,都是要调用google的云语音库,由于google被墙的原因,再加上google更擅长处理英文,所以识别效果也还一般。
3. 科大讯飞语音云,中文语音合成和识别,目前国内较为成熟的中文语音识别,主要在移动端发力,最近也已经在PC端开始布局,java版,windows版,linux版,