STRAIGHT特征提取算法学习

最新推荐文章于 2023-02-23 09:44:48 发布

zhangbin94264

最新推荐文章于 2023-02-23 09:44:48 发布

阅读量2.7k

点赞数 2

文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangbin94264/article/details/78193264

版权

本文介绍了STRAIGHT特征提取算法，主要包括F0提取的三个步骤：粗定位、轨迹平滑、精定位，以及自适应谱提取的过程，涉及语音信号预处理、功率谱提取、低频噪声补偿、过平滑补偿和无音帧处理。此外，还概述了语音非周期成分（噪声）的提取方法，通过功率谱的上包络与下包络比例来判断非周期成分的大小，以提升合成音质。

摘要由CSDN通过智能技术生成

最近看STRAIGHT特征提取算法，整理相关文档，也写些自己的理解。先整体，细节有时间再补充。

1.F0提取

STRAIGHT F0的提取主要分为：F0粗定位->F0轨迹平滑->F0精定位。

F0粗定位是指对语音信号进行小波变换，得到小波系数。再将小波系数转换为瞬时频率作为各帧的一组候选F0值。在进行小波变换前，要经过高通滤波器去除信号的直流分量；然后对信号降采样。

F0轨迹平滑指根据计算得到的高频能量比、最小噪声能量、判决门限、跳跃度（帧级别的基音频率与参考频率的误差），在一组候选F0值中寻找最可能的F0平滑曲线。

F0精定位和F0粗定位相似，也会用到瞬时频率。但F0粗定位是用小波变换得到瞬时频率，而F0精定位则是用FFT得到瞬时频率，再根据当前帧的噪声能量和语音能量对瞬时频率进行微调。

2.自适应谱提取

自适应加权谱的提取，其核心算法在于对提取出的功率谱进行一系列的平滑和补偿过程。对输入的语音信号进行：语音信号预处理 -> 功率谱提取 -> 低频噪声补偿 -> 过平滑补偿 -> 无音帧谱的处理，最后得到自适应功率谱。

其中，语音信号预处理包括让语音信号x(n)经过三个六阶butterworth高通滤波器：截止频率分别为70Hz，300Hz，3kHz。滤波得到x1(n),x2(n),x3(n)。算法通过x1(n)求取功率谱，通过x2(n),x3(n)产生无音帧功率谱的加权系数。

在提取当前帧的功率谱时，首先要设计截取帧的数据窗函数，窗函数w1(n)和频率有关，

最低0.47元/天解锁文章

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄14年

1
原创

2
点赞

5
收藏

1
粉丝

关注

私信

热门文章

STRAIGHT特征提取算法学习 2774

最新评论

STRAIGHT特征提取算法学习
烟笑彦子言: 请问博主，STRAIGHT特征提取算法，在哪里可以找到？

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。