自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

audio_algorithm的博客

专注于音频数字信号处理领域,欢迎志同道合的朋友一起探讨!

  • 博客(2)
  • 资源 (5)
  • 收藏
  • 关注

原创 Sphinx语音识别

一、语音识别简介    语音识别的一般框架一般包含几个部分:声学模型、语音模型、以及词典。语音信号(波形)经过前级处理(包括降噪,语音增强,人声检测等)后,提取特征,送入解码模块,进行解析得到识别结果。而解码模块则由 声学模型、语言模型映射、链接组成的网络。目前主流的语音模型一般采用 n-gram 语言模型,声学模型采样隐马尔科夫模型(HMM),这些模型都需要经过预先训练得到。    ...

2018-08-07 10:28:53 3462

原创 Kaldi安装编译

一、下载Kaldi下载直接利用git版本控制系统就可以了,打开终端,直接在你的实验目录下输入命令:git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden不一会就从github上下载下来了。当然,首先得确保你安装了git。要是没安装的话,就先输入:sudo apt-get insta...

2018-08-01 19:51:34 713

Download.zip

一些可以参考的行业文档知识,供学习用EVRC--ns

2019-11-29

Design of circular differential microphone array (1).pdf

Design of circular differential microphone array,

2019-06-12

keras快速入门

快速入门keras,这个是keras官网的中文翻译版本,写得还是比较详细的,适合刚入门的学习

2019-05-07

识别引擎解码1 pass VS 2 pass

识别引擎搜索策略对比,传统2 pass 方法 与 1 pass 方法(WFST)对比

2019-03-27

语音识别基本法

HMM-GMM,HMM-DNN语音识别原理介绍,比较基础,易懂。适合入门者

2019-03-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除