语音信号处理－－韩纪庆－－笔记1：声学基础及产生模型

码片向量

已于 2023-12-11 17:30:52 修改

阅读量610

点赞数 7

文章标签：信号处理语音识别笔记音视频

于 2023-11-22 20:50:52 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_68803551/article/details/134561341

版权

语音信号的声学基础及产生模型

1.语音信号产生：说话人产生想要语言表达的信息，转换成语言编码（将信息用所包含的音素序列、韵律、响度、基音周期的升降表达出来），神经肌肉命令声带振动，并塑造声道形状。

2.语音的声学特征：声波是一种纵波（传播方向和振动方向一致）。从物理描述上看，声波参数有频率－－音高；振幅－－响度。物理概念以外还有复合音（有一串倍音，但并非所有倍音都那么明显）、纯音（只有基音没有倍音－－类似周期信号的频谱谐波性收敛性）。当把声道看成一个发音的腔体时，激励的频率达到固有频率时，声道会以最大的振幅振荡，即产生共鸣，这个频率叫共振频率。

3.语音信号的时频域表示：

①时域波形：语音信号－－电信号－－A/D采样存入计算机；语音信号具有短时平稳性，元音信号具有很强的准周期性，幅度较强；辅音信号波形类似于白噪声，振幅较弱。

②频域波形：以频率为横轴，声音强弱为纵轴（单位dB）的图

③语谱图：横轴表示时间，纵轴表示频率，图上像素点的灰度值反应相应时刻、相应频率的信号能量。－－宽带语谱图频率分辨率高，呈现垂直条纹，条纹间距即为基音周期；窄带语谱图时间分辨率高，呈横杠，其为共振峰。

4.汉语中的语音分类：

辅音、单元音、复元音、复鼻尾音。

5.汉语语音的韵律特性：

音色－－由混入基音的倍音决定的；音高－－对应频率变化，基频随声调的变化而变化；音长－－发音时间的持续长短；音强－－发音轻重。

汉语语音的特点：音素少、音节少、音节简单。

6.语音信号的感知：

听觉系统（略）

听觉特性：一般来说，声音从右耳传至左脑的速度比较快；对于辅音，右耳比左耳强一些，听音调也是右耳有优势。

掩蔽效应：人耳的主观感觉（听觉）和客观实际（声波）不完全一致。掩蔽效应是一种心理声学现象，在一个较强的声音附近，相对较弱的声音不被人耳察觉。掩蔽分为同时掩蔽和异时掩蔽。同时掩蔽发生在掩蔽者和被掩蔽着同时存在，也叫频域掩蔽，能否被听到取决于强度和频率；异时掩蔽也叫时域掩蔽，分为前掩蔽（可持续20ms）和后掩蔽(可持续100ms)。

7.语音信号的线性产生模型：

激励模型（语音和噪声）－－声道模型－－辐射模型（口和唇）

8.语音信号的非线性产生模型：

调频－调幅模型（AM－FM）－－能量算子－－能量分离算法

ps：以下摘自语音信号处理-赵力：

9.语音生成系统和语音感知系统

发音系统包括口、鼻、咽、喉、气管、肺；喉的部分称为声门，由声门到嘴唇的呼吸道为声道，声道形状不断改变，发出不同声音。

听觉系统的主要部分是人耳，由内耳中耳外耳组成，内耳的主要器官是耳蜗，它将声音通过机械变换变为神经发放信号。人儿的听觉系统有两个特性--耳蜗对于声音信号的时频分析、人耳听觉掩蔽特性。

10.语音信号的数学模型

①激励模型--发浊音时声带不断开关，产生间歇性脉冲波，形状类似于斜三角波如下，即浊音为以基音周期为周期的斜三角波脉冲串；发清音时可用随机白噪声模拟。

②声道模型--两种常见建模方法：视为多个等长的不同截面的管子串联起来的系统（声管模型），或者视为一个谐振腔（共振峰模型）。基于物理学的共振峰理论可分为级联、并联、混合型共振峰模型。

③辐射模型--语音信号的声压波和从声道模型输出的速度波之比称为辐射阻抗，表征口唇的辐射效应。

综上，完整的语音信号模型可以用激励模型、声道模型、辐射模型串联表示：

关注

7
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

码片向量 CSDN认证博客专家 CSDN认证企业博客

码龄2年

15: 原创

152万+: 周排名

13万+: 总排名

6776: 访问

: 等级

266: 积分

85: 粉丝

116: 获赞

7: 评论

117: 收藏

私信

关注

热门文章

最新评论

python基础语法之list\tuple\str\set\dict
CSDN-Ada助手: 恭喜您写了第14篇博客！看到您分享关于Python基础语法中的list、tuple、str、set、dict的内容，我感到非常兴奋。您对Python基础知识的深入探讨让我受益匪浅。希望您能继续保持创作的热情，不断分享您在Python学习和实践中的心得体会。或许下一步可以考虑写一些实际的案例分析，让读者更加深入地理解这些基础语法在实际项目中的应用。当然，这只是一个建议，期待您更多精彩的作品！
语音信号的线性预测分析--语音信号处理（赵力）笔记
CSDN-Ada助手: 恭喜您写完了第12篇博客！《语音信号的线性预测分析--语音信号处理（赵力）笔记》这个标题真的很吸引人，我对这个主题非常感兴趣。您通过这篇博客向读者详细介绍了语音信号的线性预测分析，让人对语音信号处理有了更深入的了解。在下一步的创作中，我建议您可以进一步探讨一些实际应用场景，例如如何应用线性预测分析来改善语音识别准确度或者降噪等方面。同时，您也可以考虑添加一些实例和案例，以帮助读者更好地理解和应用这个技术。继续保持创作，并期待您的下一篇博客！谢谢您的分享！
python_speech_feature的fbank
CSDN-Ada助手: 恭喜你写了第13篇博客，题为“python_speech_feature的fbank”。你的持续创作令人钦佩！在这篇博客中，你详细介绍了python_speech_feature中的fbank功能，这对读者来说是非常有用的。我非常喜欢你谦虚的写作风格，并且期待你未来更多的创作。如果可以的话，我建议你可以在以后的文章中加入一些实例和案例，这样读者可以更好地理解和应用你所分享的知识。再次恭喜你，并期待你的下一篇博客！
声学与听觉语音学－－KJ－－第二部分
CSDN-Ada助手: 恭喜您写下了第二部分的声学与听觉语音学博客，这是一个非常有趣和复杂的主题。您的文章内容详实，深入浅出，让读者能够轻松理解。希望您能继续保持创作的热情，继续分享关于声学与听觉语音学的知识。或许在下一篇博客中，您可以加入一些案例分析或者实际应用，让读者更好地理解这一领域的知识。期待您的下一篇精彩文章！
声学与听觉语音学－－KJ－－第一部分.1
CSDN-Ada助手: 恭喜您写了第8篇博客！标题中的“声学与听觉语音学”让我对这个主题产生了浓厚的兴趣。这篇博客的第一部分.1让我期待着后续的内容。在这篇博客中，您对声学和听觉语音学的探索提供了有价值的见解。我希望能看到更多关于这一主题的深入分析和实践案例的分享。对于下一步的创作建议，我建议您可以继续探索声学和听觉语音学的相关概念，比如声波的传播和声音的感知机制等等。期待您的下一篇博客！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。