语音信号的时域处理(二)

通过短时时域处理技术,可获得语音信号的相关特性。今天,介绍如何利用短时自相关函数提取语音信号中的基音。

那么,什么是基音呢?声带每开启和闭合一次的时间称音调周期或基音周期,其倒数称为基音频率,简称基音。基音与个人声带的长短、薄厚、韧性、劲度和发音习惯等有关,在很大程度上反应了个人的特征。此外,基音还随人的性别、年龄而定,老年男性偏低(约50Hz),小孩和青年女性偏高(约450Hz)。基音主要应用于低码率语音编码、语音分析与合成、语音识别和说话人识别等,在语音信号领域占据非常重要的地位。

短时自相关函数公式:
在这里插入图片描述
短时自相关函数具有一些特点:
1)当k取0时,函数为最大值,此时自相关函数的取值就是该信号的短时能量(参见之前的文章);
2)如果原序列是周期为T的周期信号,那么自相关函数也是周期为T的周期函数。利用该特点,可以计算语音信号里的基音。

举个栗子:

在这里插入图片描述
在这里插入图片描述
上图是基于44100Hz采样率采集的时长为0.9秒的语音信号,设帧长为1200,帧移为600,取红框内(人声部分)的一帧,如下图所示。
在这里插入图片描述

图(a) 人声部分的某一帧

在这里插入图片描述

图(b) 该帧的自相关函数

由上图(b)所示,除去第一个最大值后(0处),最大值在k= 236处,那么该帧对应的基音频率为:

在这里插入图片描述
除此之外,短时自相关函数还可以用来进行端点检测,判断一个语音是浊音还是清音等。好了,今天的内容就讲这么多,下期见!

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

天亮继续睡

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值