语音信号处理-第三方库:librosa、nnAudio、torchAudio三者的差异
于 2022-09-13 23:03:56 首次发布
这篇博客介绍了在Python中进行语音信号处理时,librosa、nnAudio和torchAudio三个库的差异。尽管nnAudio利用一维卷积,但在功能完备性上不如librosa。文章通过梅尔谱图和谱图的实现比较,得出结论:三种库的梅尔谱图结果基本一致,而librosa.display.specshow()主要用于人眼观察,若用于模型训练应使用plt.imshow()显示图像。
摘要由CSDN通过智能技术生成