基于MATLAB的语谱图显示与分析
中文核心期刊《微计算机信息》(管控一体化)2005年第21卷第10-3期
基于MATLAB的语谱图显示与分析
TheDisplayandAnalysisofSonogramBasedonMATLAB
(1.郑州大学;2.郑州解放军信息工程大学)李富强
1
万红
1,2
黄俊杰
1
Li,FuqiangWan,HongHuang,Junjie
摘要:文章给出了一种基于MATLAB的语谱图显示原理及实现方法。该法可对语音信号(或其它类型的似平稳信号)进行频谱图的伪彩色映射及显示。语谱图的类型有宽带和窄带两种,可按需求设置伪彩色显示的映射。文中介绍了语谱图显示的原理,MATLAB的相关功能函数,并给出了一个程序实例及其实验结果。在MATLAB中进行了仿真,结果表明宽带及窄带语谱图对时间分辨率和频率分辨率的不同反映,并且该法对设备要求低,编程简单,可以在普通通用计算机上实现。
关键字:语谱图;宽带语谱图;窄带语谱图;伪彩色显示;MAT-
谱图上不仅能看出任一时刻发音器官的共振峰特征,而且可以看出语音的基音频率,是否清音、爆破音等。语谱分析在语音识别、合成及编码中很有意义。
1.1语谱图的产生基理
语音信号是一种典型的非平稳信号,但是其非平稳性是由发音器官的物理运动过程而产生的,此过程与声波振动的速度相比较缓慢,可以假定在10~30ms这样的短时间内是平稳的。傅立叶分析是分析线性系统和平稳信号稳态特性的强有力的手段,而短时傅里叶分析,也叫时间依赖傅立叶变换,就是在短时平稳的假定下,用稳态分析方法处理非平稳信号的一种方法。
设离散时域采样信号为x(n),n=0,1,…,N-1,其中n为时域采样点序号,N是信号长度。然后对信号进行分帧处理,则x(n)表示为xn(m),n=0,1,…,N-1,其中n是帧序号,m是帧同步的时间序号,N为帧长(一帧内的采样点数)。信号{x(n)}短时傅里叶变换为:
技术创新
LAB
中图分类号:TN911.72文献标识码:A文章编号:1008-0570(2005)10-3-0172-03
Abstract:Thisarticleintroducesthedisplayprincipleandreal-izationofspectrogrambasedonMATLAB.Thespectrogramofspeechsignalsandothersimilarquasi-stationaryonescanbedonebythismethod.Therearetwokindsofspectrogram:wide-bandandnarrow-bandspectrograms.Inaddition,differentpseu-do-color-mappingdisplaysareoptional.Itcoversthedisplayprincipleofspectrogram,thecorrelativefunctionsofMATLABandthesourceprogram,aswellastheexperimentalresults.ThesimulationinMATLABturnsoutthatwide-bandandnarrow-bandspectrogramsrepresentdifferentdegreesoftimeandfre-quencyresolution,respectively.ThismethodcanbeimplementedeasilywithoutcomplicatedprogrammingbasedonuniversalPC.Keywords:spectrogram;wide-bandspectrogram;narrow-bandspectrogram;pseudo-colordisplay;MATLAB
1语谱图
语音的发音过程中,声道通常都是处于运动状态的,因此它的共振峰特性也是时变的。不过这个时变过程比起振动过程来说要缓慢得多,因此一般可以假定它是短时平稳的,每一时刻我们都可以用这时刻附近的一短段(例如15ms)语音信号分析得到一种频谱。
对语音信号连续地进行频谱分析就可以得到一种二维图谱,其横坐标表示时间,纵坐标表示频率,而每像素的灰度值大小反映相应时刻和相应频率的信号能量密度。这种时频图称为语谱图(Sonogram或Spec-trogam),这种反映语音信号动态频谱特性的时频图在语音分析中有重要实用价值,被视为可视语言。从语李富强:硕士研究生
基金资助:河南省骨干教师资金资助
中国自控网:http://www.autocontrol.com.cn-元/:
它是信号x(n)的短时自相关函数的傅里叶变换。用时间n作为横坐标,k作纵坐标,将P(n,k)的值表示为灰度级所构成的二维图像就是语谱图。通过变换10log10
(P(n,k))能得到语谱图的dB表示。
1.2语谱图的伪彩色映射
对P(n,k)实施伪彩色映射,可以得到具有较高分辨率和较好视觉效果的伪彩色语谱图。把P(n,k)的最
电话:010-62132436,62192616(T/F)
《变频器与软启动器应用200例》