浅谈语音信号处理系列之二语音信号处理的基础

最新推荐文章于 2022-09-29 20:10:38 发布

Audio_Wang

最新推荐文章于 2022-09-29 20:10:38 发布

阅读量4.1k

点赞数

分类专栏： Speech Signal Processing 文章标签： matlab fft filter 语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wanggp_2007/article/details/4719111

版权

Speech Signal Processing 专栏收录该内容

17 篇文章 3 订阅

订阅专栏

下面简单扼要的总结几个基本概念，如果想深入了解请告诉我或者直接参考相关文献。

一语音信号的产生

一般来说，声音是通过振动产生的。同样，语音是肺里面的空气形成气流通过声道，再从口

鼻辐射而产生的。语音信号主要是由三种成分组成：浊音、清音和爆破音组成，这三种不同

的发音取决于声带的振动和发音器官（口鼻舌等）的位置和状态。如果用信号系统的角度来

看，气流通过声门（声带）形成激励源，从声门到口鼻这段腔体是一个时变的系统，当然语

音就是输出的时变信号了。只有搞清楚激励源和时变系统的特性，才能真正明白语音信号的

产生，从而进行更深入的研究。

二描述语音特性的几个概念
1、物理属性：
1）音调：音高，是声音振动的频率；
2）音强：音量，声音震动的强弱；
3）音长：声音的长短；
4）音色：音质，声音的内容和特质，与声带振动频率、激励源和声道的形状等有

关。
2、基本单位
1）最基本的单位：音素，分为浊音和清音。
2）最小发音单位：音节，由音素组成。音节=元音+辅音，而没有说音节=浊音+清

音，这是因为二者不是一个领域范畴的表述，一个是语言学构成，另一个是语音成分组成，

另外辅音分为清辅音和浊辅音，元音和浊辅音表示了声带振动，清辅音声带不振动。
3）汉语语音=声母+韵母+音调
3、共振峰特性
当振动频率与系统的固有频率一致时，就会引起共振现象。声道是一个具有某种谐振特性的

腔体，可以与语音在多个频率上发生谐振，这些谐振的位置称为共振峰，它对语音信号产生

了很大的影响。

4、掩蔽效应
从人耳的感知特性出发，是一种心理声学现象，以后会再详细介绍。

三语音信号与音频信号的关系
语音信号的频率范围是200~3400Hz左右，人们可听到的音频信号范围是20~20KHz，显然语音

信号属于音频信号，那为什么还特别强调语音信号的研究呢？
1、语音信号和音频信号的处理对象不同，语音信号主要是以人发声为研究对象，而音频信

号则是以自然界所有的声音为研究对象；
2、研究方法不同，语音信号主要从人的发声机理为基础，建立发声系统模型，分析系统特

性；而音频信号的来源太多了，所以它是以人的听觉特性为基础，建立人耳系统模型，分析

系统特性。
3、语音信号具有更多的实际研究价值和应用价值。

四语音信号处理的常用技术
1、时域分析
   通过将语音信号分帧，转化时变信号为时不变信号以进行处理。
1）短时能量
2）短时平均过零率
3）短时自相关运算
2、频域分析
1）傅里叶变换（FFT）
2）滤波器组（Filter Bank）
        3）基于听觉特性的Mel频率倒谱分析
        4）基于线性预测（LPC）的倒谱分析
3、两个关键参数
1）基音频率（Pitch）
2）线性预测系数（LPC）

五语音信号处理的常用软件
1、Matlab
2、Cool Edit
。。。。。。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
浅谈语音信号处理系列之二语音信号处理的基础

下面简单扼要的总结几个基本概念，如果想深入了解请告诉我或者直接参考相关文献。一语音信号的产生一般来说，声音是通过振动产生的。同样，语音是肺里面的空气形成气流通过声道，再从口鼻辐射而产生的。语音信号主要是由三种成分组成：浊音、清音和爆破音组成，这三种不同的发音取决于声带的振动和发音器官（口鼻舌等）的位置和状态。如果用信号系统的角度来看，气流通过声门（声带）形成激励源，从声门到口
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。