语音信号的产生模型

最新推荐文章于 2024-02-20 16:39:33 发布

xiaoding133

最新推荐文章于 2024-02-20 16:39:33 发布

阅读量7.6k

点赞数 2

分类专栏：信号处理/语音识别文章标签： signal intervals 电话

本文链接：https://blog.csdn.net/xiaoding133/article/details/6978500

版权

信号处理/语音识别专栏收录该内容

19 篇文章 3 订阅

订阅专栏

1.语音的产生

a.有声激励：声门关闭。气流迫使声门周期的打开和关闭产生浊音或一些元音。该周期的倒数为“基音频率”（fundamental frequency），该频率在80Hz-350Hz。

b.无声激励：声门打开并且穿过嘴的一个小的空间，该过程产生清音，如同噪声信号，该信号的频谱由该小空间所处的位置。

c.瞬时激励：嘴中的气流压在嘴突然打开空气流瞬间冲出产生爆破音。

注：还有其他的一些语音是以上三种激励的组合。语音信号谱的形状由声道形状决定（舌头的位置，牙齿，嘴唇）。

2.语音信号的特点

语音信号有如下特点：

a.信号的带宽为4KHZ b.语音信号的基音频率范围是80Hz~350Hz c.在如下能量谱范围内出现峰值

(2n − 1) ∗ 500 Hz ; n = 1, 2, 3, . . .

d.信号的功率谱包络随着频率的增加呈现下降的趋势。

注明：其实语音信号的带宽要大于上面说的4KHz，例如一些摩擦音也是频谱能量中重要的高频成分，但是对于电话，平常说话时候的语音，带宽为4KHZ完全包含了人们理解内容的必要信息。还有在上面提到的频谱峰值就是共振峰。共振峰的改变由声道的形状决定。

3.一个简单的语音产生模型

语音产生的过程包括三部分：激励模型，声道模型以及辐射模型。

语音信号的频谱为：

R(f)为辐射模型。

在模型中，影响语音信号的主要参数如下：

•the mixture between voiced and unvoiced excitation (determined by v and u)
• the fundamental frequency (determined by P(f))
• the spectral shaping (determined by H(f))
• the signal amplitude (depending on v and u)

在语音识别中，需要对语音进行分析，提取语音信号中最重要的信息。

the most valuable information is contained in the way the spectral shape of the speech signal changes in time. To reflect these dynamic changes, the spectral shape is determined in short intervals of time, e.g., every 10 ms.By directly computing
the spectrum of the speech signal, the fundamental frequency would be implicitly contained in the measured spectrum。下图为一个元音的对数功率谱图：

元音 /a:/ (采样频率fs = 11kHz, 长度length = 100ms).

上面的时间信号波峰是由有声激励的P(f)引起的。我们可以通过带通滤波器来观察该信号的频谱形状，平滑滤波器的输出，每个滤波器的输出代表该频带范围的能量。

xiaoding133

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
语音信号的产生模型

1.语音的产生 a.有声激励：声门关闭。气流迫使声门周期的打开和关闭产生浊音或一些元音。该周期的倒数为“基音频率”（fundamental frequency），该频率在80Hz-350Hz。 b.无声激励：声门打开并且穿过嘴的一个小的空间，该过程产生清音，如同噪声信号，该信号的频谱由该小空间所处的位置。 c.瞬时激励：嘴中的气流压在嘴突然
复制链接

扫一扫