语音信号处理--韩纪庆--笔记1:声学基础及产生模型

语音信号的声学基础及产生模型

1.语音信号产生:说话人产生想要语言表达的信息,转换成语言编码(将信息用所包含的音素序列、韵律、响度、基音周期的升降表达出来),神经肌肉命令声带振动,并塑造声道形状。

2.语音的声学特征:声波是一种纵波(传播方向和振动方向一致)。从物理描述上看,声波参数有频率--音高;振幅--响度。物理概念以外还有复合音(有一串倍音,但并非所有倍音都那么明显)、纯音(只有基音没有倍音--类似周期信号的频谱谐波性收敛性)。当把声道看成一个发音的腔体时,激励的频率达到固有频率时,声道会以最大的振幅振荡,即产生共鸣,这个频率叫共振频率

3.语音信号的时频域表示:

①时域波形:语音信号--电信号--A/D采样存入计算机;语音信号具有短时平稳性,元音信号具有很强的准周期性,幅度较强;辅音信号波形类似于白噪声,振幅较弱

②频域波形:以频率为横轴,声音强弱为纵轴(单位dB)的图

③语谱图:横轴表示时间,纵轴表示频率,图上像素点的灰度值反应相应时刻、相应频率的信号能量。--宽带语谱图频率分辨率高,呈现垂直条纹,条纹间距即为基音周期窄带语谱图时间分辨率高,呈横杠,其为共振峰

4.汉语中的语音分类:

辅音、单元音、复元音、复鼻尾音。

5.汉语语音的韵律特性:

音色--由混入基音的倍音决定的;音高--对应频率变化,基频随声调的变化而变化;音长--发音时间的持续长短;音强--发音轻重。

汉语语音的特点:音素少、音节少、音节简单。

6.语音信号的感知:

听觉系统(略)

听觉特性:一般来说,声音从右耳传至左脑的速度比较快;对于辅音,右耳比左耳强一些,听音调也是右耳有优势

掩蔽效应:人耳的主观感觉(听觉)和客观实际(声波)不完全一致。掩蔽效应是一种心理声学现象,在一个较强的声音附近,相对较弱的声音不被人耳察觉。掩蔽分为同时掩蔽和异时掩蔽。同时掩蔽发生在掩蔽者和被掩蔽着同时存在,也叫频域掩蔽,能否被听到取决于强度和频率;异时掩蔽也叫时域掩蔽,分为前掩蔽(可持续20ms)和后掩蔽(可持续100ms)

7.语音信号的线性产生模型:

激励模型(语音和噪声)--声道模型--辐射模型(口和唇)

8.语音信号的非线性产生模型:

调频-调幅模型(AM-FM)--能量算子--能量分离算法

ps:以下摘自语音信号处理-赵力:

9.语音生成系统和语音感知系统

发音系统包括口、鼻、咽、喉、气管、肺;喉的部分称为声门,由声门到嘴唇的呼吸道为声道,声道形状不断改变,发出不同声音。

听觉系统的主要部分是人耳,由内耳中耳外耳组成,内耳的主要器官是耳蜗,它将声音通过机械变换变为神经发放信号。人儿的听觉系统有两个特性--耳蜗对于声音信号的时频分析、人耳听觉掩蔽特性。

                   

10.语音信号的数学模型

①激励模型--发浊音时声带不断开关,产生间歇性脉冲波,形状类似于斜三角波如下,即浊音为以基音周期为周期的斜三角波脉冲串;发清音时可用随机白噪声模拟。

                                        

②声道模型--两种常见建模方法:视为多个等长的不同截面的管子串联起来的系统(声管模型),或者视为一个谐振腔(共振峰模型)。基于物理学的共振峰理论可分为级联、并联、混合型共振峰模型。

③辐射模型--语音信号的声压波和从声道模型输出的速度波之比称为辐射阻抗,表征口唇的辐射效应。

综上,完整的语音信号模型可以用激励模型、声道模型、辐射模型串联表示:

      

  • 7
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值