《语音信号处理》学习笔记

最新推荐文章于 2024-07-17 14:05:22 发布

by21010

最新推荐文章于 2024-07-17 14:05:22 发布

阅读量4.1k

点赞数 4

分类专栏：语音信号处理学习个人笔记 speech

本文链接：https://blog.csdn.net/by21010/article/details/48576835

版权

本文详细介绍了语音信号处理的基本概念，包括语音、音节、音素等，并深入探讨了语音信号的数字化和预处理，时域分析（如短时能量、过零率和相关分析），频域分析（短时傅里叶变换、谱临界特征矢量）以及倒谱分析。内容涵盖预加重、加窗分帧、量化信噪比计算等关键技术。

摘要由CSDN通过智能技术生成

                    
                        
                    
                    一、基本概念 
语言：从人们的话语中概括总结出来的规律性符号系统。
语音：一连串音组成的声音。
音节：具有一个响亮的中心，并被明显感觉到的语音片段。
音素：发音最小片段。分为元音、辅音（清音、浊音、半元音）。 
 
  元音：声腔开放。
辅音：声腔受阻。（唇舌位置，形状）
共振峰：元音激励进入声道引起的共振特性。 
 
  F1：舌位高则低
F2：舌位前则高
F3：舌尖卷则低 
鼻化：共振峰加上了两对零极点。
元音发音方式： 
 
  声道受声带振动；
声道不极端狭窄，形状持续稳定；
与鼻腔不耦合；
浊音（声带振动）：基音频率→声调轨迹→韵律
重音：时长、音高，音强不重要。
汉语声韵结构：V,CV,VC1，CVC1
声调：浊音基音周期的变化；
基音周期：声带振动周期；
语谱图：横轴-时间，纵轴-频率，深浅-强弱。
幅度符合Gamma分布： 
 
    PG(x)=x−−√2π−−√e−k|x|∣x∣−−√wherek=3√2σx  
  
 
二、语音信号分析 
1、数字化和预处理 
预滤波：滤除 fs2 以外的分量；抑制50Hz工频。 
 
  电话→ fH=3400Hz,fL=60到100Hz,fs=8kHz 
高要求→ fH=4500Hz,fL=60Hz,fs=10kHz 
量化： 
 
  量化噪声：当信号波形足够大或者量化间隔足够小时，可以证明量化噪声符合①平稳的白噪声；②量化噪声与输入信号不相关③量化噪声在量化间隔内均匀分布。
量化信噪比有 
 
      SNR(