第二讲:
1. 语音特征:音色,音调,响度,(音长)。
2. 完整的语音信号生成的数学模型:激励模型(一般分为浊音激励和清音激励),声道模型(一般分为声管模型和共振峰模型),共振峰模型又分为三种:级联,并联,混合型),辐射模型。
3. 浊音激励模拟成是一个以基音周期为周期的斜三角脉冲串。可以把清音模拟成随机白噪声。
4. 完整的语音信号的数学模型的传输函数 H(z) = A*U(z)V(z)R(z).一阶高通形式的 R(z)=R0(1-z^(-1))
5. 语谱图:把和时序相关的傅里叶分析的显示图形。语谱图是一种三维频谱,它是表示语音频谱随时间变化的图形。
6. 共振峰:元音激励进入声道时引起共振特性,产生一组共振频率。
7. 对发音影响最大的是声带。
8. 语音听觉系统:耳:内耳(将机械信号转化为神经信号),中耳(声阻抗变换),外耳(声源定位和声音放大)。
9. 掩蔽效应:在一个强信号附近,弱信号将变得不可闻。被掩蔽掉的不可闻信号的最大声压级称为掩蔽门限或掩蔽阈值。掩蔽效应分类:同时掩蔽和短时掩蔽。同时掩蔽:存在一个弱信号和一个强信号频率接近,强信号会提高弱信号的听阀,当弱信号的听阀被升高到一定程度就会导致这个弱信号弱不可闻。短时掩蔽:当 A 声和 B 声不同时存在时也存在掩蔽作用,称为短时掩蔽。
10. 共振峰模型
级联型共振峰模型
并联型共振峰模型
混合型共振峰模型
11. 语音信号生成的数学模型
12. 语音信号的数字化
13. 数字化和预处理:数字化:带通滤波,增益控制,模数转换,编码调制。
预处理:预加重,加窗,分帧。
预滤波的目的(作用):①抑制高频分量,防止混叠干扰②抑制电源工频干扰
14. 若信号波形的变化足够大,或量化间隔△足够小时,量化噪声有如下特征:①它是平稳的白噪声过程②量化噪声与输入信号不相关③量化噪声在量化间隔内均匀分布,即具有等概率密度分布
15. 预滤波器是一个带通滤波器,其上下截止频率分别为 fH= 3400HZ fL=60-100HZ 采样频率为 fS=8KHZ。
16. 预加重数字滤波器一般是一阶的数字滤波器 H(Z)=1-uz^(-1)
17. 加窗,分帧的窗口的窗函数:要减小窗两端的坡度,使窗口边缘两端不引起急剧变化而平滑过渡到零,这样可以减小语音帧的截断效应,在频域要有较宽的3db带宽以及较小的边带最大值。
18. 语音输入到输出过程:
语音输入->反混叠滤波->模数变换->分析处理->传输或存储->合成处理->数模变换->平滑滤波->语音输出