python信号处理算法库_语音信号处理之时域分析-音高追踪及其Python实现

本文介绍了音高追踪在语音信号处理中的重要性,并详细阐述了音高追踪的基本流程,包括切音框、排除不稳定音高、平滑化处理。讨论了ACF、AMDF等时域算法,以及它们的改进方法,为Python语音信号处理提供实践指导。
摘要由CSDN通过智能技术生成

1.概述

在音高及其Python实现一文

中,我们使用了简单的“观察法”来计算音高,这并不太难,但这并不有好而且费时费力,那么我们就想,如何通过分析和计算,使用算法来自动计算音高呢?

用算法让计算机自动抓取音高的过程,称为音高追踪(Pitch Tracking)。所得到的音高信息有如下一些应用:

·旋律识别(Melody Recognition):或称为“哼唱选歌”,也就是如何由使用者的哼唱,找出音乐资料库中间对应的歌。

·汉语声调识别(Tone Recognition):辨识使用者讲一句话时,每一个字的声调(一声、二声、三声、四声等)。

·语音合成韵律分析(Prosody Analysis)中的音高分析:如何在合成语音时,使用最自然的音高曲线。

·语音评分中的音调评分(Intonation Assessment):如何评估使用者说话的语音,其音高曲线是否标准。

·语音识别(Speech Recognition):我们可以使用语句的音高来提高语音辨识的正确率。

总而言之,音高追踪是语音信号处理中最基本也最重要的一个环节之一。

2.音高追踪的基本流程

音高追踪的基本流程如下:

(1)将整段音讯讯号切成音框(Frames),相邻音框之间可以重叠。

(2)算出每个音框所对应的音高。

(3)排除不稳定的音高值。(可由音量来筛选,或由音高值的范围来过滤。)

(4)对整段音高进行平滑化,通常是使用「中位数滤波器」(Median Filters)。

在切音框的过程中,我们允许左右音框的

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值