实验内容
1、了解汉语普通话拼音中浊音与清音以及爆破音的区别
2、使用audacity音频分析软件录制不同的语音信号并分析频谱
基础背景知识
首先经过一些j简单的背景知识了解到,语言中清浊音是一组对立关系,而爆破音是另外一种分类定义。其中清音又分为送气清音和不送气清音。[1]
清音与浊音的根本区别在于声带的振动。清音几乎没有振动,而浊音有强烈的振动。 事实上,汉语的浊声母很少,只有m、n、l、r几个,其他都是清声母。发清声母声带不振动.b、p、d、t,这些声母发音很轻,声带是不振动的。但听的人不容易听到,所以在教学上用教学音来演示,就是在这些声母后加上韵母o.我们平常读b其实是读的bo的音,所以声带振动了.如果用英语来作例子,比如sport,其中的s、t就有点像单纯的声母的发音,不带韵母,所以发音很轻。[2]
而爆破音是指发音器官在口腔中形成阻碍,然后气流冲破阻碍而发出的音。这些音有6个,即/p/,/b/,/t/,/d/,/k/和/g/。
实验结果及分析
根据上述背景,再结合普遍认为的清浊音和爆破音,我在Audacity中进行了对于汉语拼音中m/l(浊音),f/zh/ch/z/c(清音),b/p/t(爆破音)的语言信号分析。
1、浊音m/l
m语音的频谱分析
m语音的时域分析
l语音的频谱分析
l语音的时域分析
由图中可以看出,浊音的频谱在200Hz至1000Hz左右之间有明显的几个峰值存在。从时域上看,有较明显的周期变化。
2、清音f/zh/z
f语音的频谱分析
f语音的时域分析
zh/z语音的频谱分析 (声带振动)
zh/z语音的时域分析 (声带振动)
zh/z语音的频谱分析 (声带不振动)
zh/z语音的时域分析 (声带不振动)
从几组图中分析,清音在带有声带振动时的频谱与浊音有一点类似,在300Hz至1300Hz左右出现多组峰值。其中在zh/z的频谱对比中还可以看到zh在高频出的峰值更大,而z在相对低频出的峰值较大。
再对比不加声带振动的情况:由于声带无明显振动,音量明显减弱,因此受外界噪声的干扰影响很大。从频谱中看到能量大都集中在低频,且相对来说zh的频谱在处出现峰值,这与有声带振动的频谱有相似之处。
从时域上看前三者都有一定的周期变化,特别是zh的时域有非常明显的周期性。而后两者因为声音幅度小,变化不明显,甚至与噪声信号没差。
3、爆破音b/p/t
b语音的频谱分析
b语音的时域分析
p语音的频谱分析
p语音的时域分析
t语音的频谱分析
t语音的时域分析
由上图可以看出,爆破音的频谱与前几组语言信号的特征仍有相似之处,即在300Hz至1300Hz左右出现多组峰值。除此之外,据测量在538Hz至1049Hz之间的峰值相近。
从时域上看,爆破音的时域有非常明显的变化,应该是由于爆破音的发音方式使得音量增大,导致时域信号幅度增大。
结论
1、语音信号由于不同的发音方式其频率分布会产生一定的差异。
2、由于声带振动,音量增大影响信号的幅度,但是频率分布的变化较小。
问题与收获
1、对于语言学的知识收集还不够充分,没有查找相应文献支持的理论。其实清浊音对于汉语普通话、汉语方言、甚至外语都有许多区别与联系值得我们进一步了解,由此才能更好地进行频谱和时域分析。
2、实验环境和设备不算严谨,语言信号中有避免不了的各类噪声,会影响实验效果。
3、从本次实验中,我了解和学习使用了Audacity音频分析软件,了解了不同语音信号的时域和频域特性,为之后的学习和实验打下了基础,也有利于未来课程以及其他专业知识的学习。
参考链接