- 博客(14)
- 资源 (2)
- 收藏
- 关注
转载 关于python和speech
https://github.com/ibillxia/pyssp#userconsent#http://ibillxia.github.io/blog/archives/http://ibillxia.github.io/blog/2013/04/17/Deep-Learning-and-its-application-in-audio-and-speech-processing/
2016-08-11 15:26:39 1094
转载 Motivation behind REVERB challenge
The challenge is comprised of two types of tasks: ASR and SE. In the ASR task, the submitted systems are evaluated in terms of word error rate (WER), and in the SE task, an SE algorithm’s performanc
2016-07-21 14:02:41 766
转载 Sphinx-4 Application Programmer's Guide学习
https://sourceforge.net/projects/cmusphinx/files/sphinx4/5prealpha/Using in your projectsAs any library in Java all you need to do to use sphinx4 is to add jars into dependencies of your
2016-07-17 15:36:13 696
转载 sphinx4
https://www.ibm.com/developerworks/cn/opensource/os-sphinxspeechrec/http://www.voidcn.com/blog/RFC2008/article/p-1873051.htmlhttp://blog.csdn.net/nnmmbb/article/details/49785535http://
2016-07-14 10:37:55 735
转载 基于麦克风阵列的混响环境下声源定位和波束形成技术的研究
摘要随着通信产业以及人机交互接口的高速发展,声源定位已成为一个备受瞩目的研究课题和迫切需要。在实际应用中,语音信号处理系统在很多情况下会受到空间噪声以及室内混晌的影响。因此,噪声及混响背景下的声源定位,是麦克风阵列信号处理必然要面对的一个重要问题。本文首先介绍了麦克风阵列相关的理论基础,如语音信号和噪声信号特性,以及适用于麦克风阵列研究的远近场信号模型、混响信号模型,空间采样定理等。而后系
2016-06-16 09:15:32 6550 1
原创 传声器学习
传声器工作原理•动圈式话筒是依据电磁感应原理制成的,接受声波的膜片发生受迫振动,带动处于恒定磁场内的线圈,从而产生—交变的感应电动势,形成变化着的电信号。•电容话筒是依据接收声波的膜片构成电容,受迫振动后,其电容量发生变化从而产生—交变电压,形成变化着的电信号。国外话筒的概况 世界上话筒生产技术一流的国家是德国、奥地利、美国,
2016-06-14 16:49:00 526
原创 基于 HMM 模型的语音识别语音识别中使用 HMM 通常是用从左向右单向、带 自环、带跨越的拓扑结构来对识别基元建模 , 一个音素 就是一个三至五状态的 HMM , 一个词就是构成词的多 个音素的 H
在实时录音的情况下 , 利用该语音识别系统 , 不同的人对 20 条 2~8 个字的语音命令进行识别 , 准确率可达到 95 % , 识别时间115~3 s , 实现了小词汇量连续语音的非特定人的实时识别。目前 , 用于语音识别的方法有基于动态时轴归整(DTW) 技术的模板匹配法、基于概率统计的 HMM 法和基于人工神经网络 (ANN) 的最优搜索法。当录音控件录音完成并进行端点检测后
2016-06-11 20:49:58 3852
原创 DTW算法实现及语音模板匹配
实验目的 运用课堂上所学知识以及matlab工具,利用DTW(Dynamic Time Warping,动态时间规整)算法,进行说话者的语音识别。实验原理 1、语音识别系统概述 一个完整特定人语音识别系统的方案框图如图1所示。输入的模拟语音信号首先要进行预处理,包括预滤波、采样和量化、加窗、端点检测、预加重等,然后是参数特征量的提取。提取的特征参数满足如下要求: (1)特征参数
2016-06-10 17:29:40 7147
原创 MFCC特征提取
实验目的 1、熟练运用MATLAB软件进行语音信号实验; 2、熟悉短时分析原理、MFCC的原理; 3、学习运用MATLAB编程进行MFCC的提取; 4、学会利用短时分析原理提取MFCC特征序列;实验原理 MFCC: 语音识别和说话人识别中,常用的语音特征是基于Mel频率的倒谱系数(即MFCC)。MFCC参数是将人耳的听觉感知特性和语音的产生机制相结合。 Mel频率可以用
2016-06-10 17:28:43 3440
原创 LPC特征提取
实验目的 1、熟练运用MATLAB软件进行语音信号实验; 2、熟悉短时分析原理、LPC的原理; 3、学习运用MATLAB编程进行LPC的提取; 4、学会利用短时分析原理提取LPC特征序列。 LPC分析基本原理 LPC分析为线性时不变因果稳定系统V(z)建立一个全极点模型,并利用均方误差准则,对已知的语音信号s(n)进行模型参数估计。显
2016-06-10 16:52:38 8149
原创 基音周期估计
实验目的 本次试验的目的是通过matlab编程,验证课本中基音周期估计的方法,本实验采用的方法是自相关法。实验原理 1、基音周期 基音是发浊音时声带震动所引起的周期性,而基音周期是指声带震动频率的倒数。基音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码,发音系统疾病诊断、
2016-06-10 16:31:54 5552
原创 端点检测
.实验目的 1.语音信号端点检测技术其目的就是从包含语音的一段信号中准确地确定语音的起始点和终止点,区分语音和非语音信号,它是语音处理技术中的一个重要方面。本实验的目的就是要掌握基于MATLAB编程实现带噪语音信号端点检测,利用MATLAB对信号进行分析和处理,学会利用短时过零率和短时能量,对语音信号的端点进行检测。实验原理 1、短时能量 语音和噪声的区别可以体现在它们
2016-06-10 15:28:04 8828 3
转载 语音信号去混响原理与技术
http://read.pudn.com/downloads94/sourcecode/speech/376618/sound/%E8%AF%AD%E9%9F%B3%E4%BF%A1%E5%8F%B7%E5%8E%BB%E6%B7%B7%E5%93%8D%E5%8E%9F%E7%90%86%E4%B8%8E%E6%8A%80%E6%9C%AF.pdf语音信号去混响技术在通信、语言识别等方面
2016-06-09 12:26:21 11101 1
转载 http://my.oschina.net/u/2352897/blog
从今天开始之前在http://my.oschina.net/u/2352897/blog的博客全部引到这边
2016-06-09 12:24:15 1380
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人