语音信号处理-第三方库:librosa、nnAudio、torchAudio三者的差异

这篇博客介绍了在Python中进行语音信号处理时,librosa、nnAudio和torchAudio三个库的差异。尽管nnAudio利用一维卷积,但在功能完备性上不如librosa。文章通过梅尔谱图和谱图的实现比较,得出结论:三种库的梅尔谱图结果基本一致,而librosa.display.specshow()主要用于人眼观察,若用于模型训练应使用plt.imshow()显示图像。
摘要由CSDN通过智能技术生成

python可以使用的语音处理第三方库一览图
在这里插入图片描述
如果你只是使用pytorch, 需要关注nnAudio, torchAudio, librosa这三个模块,如上所示,nnAudio有很多优点,它是使用一维卷积实现的一个库,但是一些常用的功能,比如音频加载,谱图显示,幅度转为DB等它都没有,很多时候,还是要使用librosa配合。

下面是三个模块的简单使用

from nnAudio import Spectrogram
import nnAudio
import torchaudio.functional as F
import torchaudio
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值