python计算短时自相关函数音频信号_librosa与python_speech_features

最新推荐文章于 2024-09-14 09:14:56 发布

weixin_39793564

最新推荐文章于 2024-09-14 09:14:56 发布

阅读量605

点赞数

文章标签： python计算短时自相关函数音频信号 python语音信号时频分析

本文介绍了在语音识别领域中，librosa和python_speech_features两个模块的功能和区别。librosa功能更全面，涉及音频特征提取、谱图分解等，而python_speech_features专注于音频特征提取，如MFCC、滤波器组能量等。python_speech_features的预加重参数简化了高频信号增强操作。

摘要由CSDN通过智能技术生成

在语音识别领域，比较常用的两个模块就是librosa和python_speech_features了。

最近也是在做音乐方向的项目，借此做一下笔记，并记录一些两者的差别。下面是两模块的官方文档

LibROSA - librosa 0.6.3 documentationlibrosa.github.io Welcome to python_speech_features’s documentation!python-speech-features.readthedocs.io

直接对比两文档就可以看出librosa功能十分强大，涉及到了音频的特征提取、谱图分解、谱图显示、顺序建模、创建音频等功能，而python_speech_features只涉及了音频特征提取。就特征提取的实现方法和种类来看，两者也有所不同。

python_speech_features的特征

支持的特征：

python_speech_features.mfcc() - 梅尔倒谱系数
python_speech_features.fbank() - 滤波器组能量
python_speech_features.logfbank() - 对数滤波器组能量
python_speech_features.ssc() - 子带频谱质心特征

提取mfcc、logfbank特征的方法

from

python_speech_features的比较好用的地方就是自带预加重参数，只需要设定preemph的值，就可以对语音信号进行预加重，增强高频信号。

python_speech_features模块提供的函数

python_speech_f

最低0.47元/天解锁文章

weixin_39793564

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。