语音识别技术与应用
duganlx
业精于勤,荒于嬉;行成于思,毁于随
展开
-
基于听觉特性的Mel频率倒谱分析
基于听觉特性的Mel频率倒谱分析心理学研究表明:人类对于声音音调的感觉其实都不是线性的客观上:用频率表示主观上:音调的单位用Mel标度公式根据人耳对低频信号比对高频信号更敏感这一原则,研究者根据心理学实验得到了类似于耳蜗作用的一组滤波器组 ,这就是Mel频率滤波器组。滤波器组一般为20-40个(26个最好)三角形滤波器Mel-频率目的:模拟人耳对不同频率语音的感知人类对不...原创 2020-04-01 11:25:47 · 2132 阅读 · 0 评论 -
离散余弦变换(学习笔记)
离散余弦变换离散余弦变换(Discrete Cosine Transform, DCT)是与傅里叶变换相关的一种变换,类似于离散傅里叶变换,但是只使用了实数离散余弦变换相当于一个长度大概是它两倍的离散傅里叶变换,这个离散傅里叶变换是对一个实偶函数进行的(因为一个实偶函数的傅里叶变换仍然是一个是偶函数)离散余弦变换是根据下面的公式把n个实数x(0) , x(1) ,„x(n-1)变换到另外n个...原创 2020-04-01 11:09:20 · 3263 阅读 · 0 评论 -
语音信号的倒谱域分析
语音信号的倒谱域分析倒谱的概念定义:倒谱定义为信号短时振幅谱(功率谱)的对数傅里叶反变换特点:具有可近似地分离并能提取出频谱包络信息和细微结构信息的特点。倒谱的分析流程IDFT:离散傅里叶逆变换A:短时信号B:短时频谱C:对数频谱(取对数可以将乘性信号转变为加性信号)D:倒谱系数E:对数频谱包络(外面的大体情况)F:基音周期倒谱系数的求法倒谱分析在语音识别中的用途...原创 2020-04-01 11:03:07 · 4027 阅读 · 0 评论 -
语音信号的频域分析
语音信号的频域分析语音的感知过程与人类听觉系统具有频谱分析功 能紧密相关。因此,对语音信号进行频谱分析, 是认识语音信号和处理语音信号的重要方法声音从频率上可以分为纯音和复合音。纯音只含 一种频率的声音(基音),而没有倍音。复合音是 除基音外,还包含多种倍音的声音。大部分声音 (包括语音)都是复合音,涉及多个频率段。离散傅里叶变换(DFT)复指数运算:实部是Cosine函数,虚部是S...原创 2020-04-01 10:54:25 · 13372 阅读 · 0 评论 -
语音信号的预处理
概述语音信号是一种非平稳的时变信号,它携带着大量信息。在语音编码、语音合成、语音识别和语音增强等语音处理中,都需要提取语音中包含的各种信息语音处理的目的对语音信号进行分析,提取特征参数,用于后续处理加工语音信息,如语音增强和语音合成中的应用根据所分析的参数类型,语音信号可以分成:时域分析最简单、最直观直接对语音信号的时域波形进行分析特征参数:语音的短时能力、平均幅度、短时...原创 2020-03-30 21:13:42 · 6874 阅读 · 1 评论 -
语音信号短时时域分析
语音信号短时时域分析类型短时能量对数平方和绝对值短时平均过零率短时自相关分析说明语音信号的分帧处理,实际上就是对各帧进行某种变换或运算。T[ ]:表示这种变换或运算x(n):输入语音信号w(n):窗序列h(n):是与w(n)有关的滤波器则各帧经处理后的输出可以表示为:几种常见的短时处理方法:Qn对应于短时能量Qn对应于平均过零率Qn对应于自...原创 2020-03-30 18:42:16 · 5414 阅读 · 4 评论