天池--零基础入门语音识别之食物声音识别--task02

Python 音频信号处理库 librosa–入门

1,音频处理

filename = librosa.example('nutcracker')
  • 获取librosa随附的音频示例文件的路径。在此步骤之后, filename将是一个字符串变量,其中包含示例音频文件的路径。
    在这里插入图片描述
y, sr = librosa.load(filename)
  • librosa.load()
    • 以时间序列的 y形式加载和解码音频,以一维NumPy浮点数组表示y。
    • 可变SR包含采样速率的 y,即,每秒音频的样本的数目。默认情况下,所有音频在加载时混合为单声道并重新采样为22050 Hz。可以通过向提供其他参数来覆盖此行为,
    • 从文件加载音频数据,貌似没有格式限制,而且可以通过参数设置是否保留双声道,采样率,重采样类型。

在这里插入图片描述

import matplotlib.pyplot as plt
import librosa.display
plt.figure(figsize=(14, 5))
librosa.display.waveplot(y,sr=sr)
  • 查看波形幅度包络图
    在这里插入图片描述
import numpy as np
plt.figure(figsize=(20, 10))
D = librosa.amplitude_to_db(np.abs(librosa.stft(y)), ref=np.max)
plt.subplot(4, 2, 1)
librosa.display.specshow(D, y_axis='linear')
plt.colorbar(format='%+2.0f dB')
  • 查看声谱图

    • 声谱图(spectrogram)是声音或其他信号的频率随时间变化时的频谱(spectrum)的一种直观表示。声谱图有时也称sonographs,voiceprints,或者voicegrams。当数据以三维图形表示时,可称其为瀑布图(waterfalls)。在二维数组中,第一个轴是频率,第二个轴是时间。我们使用librosa.display.specshow来显示声谱图。

在这里插入图片描述

参考资料:
librosa教程https://librosa.org/doc/latest/tutorial.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值