import librosa
import librosa.display
import matplotlib.pyplot as plt
from matplotlib.patches import Rectangle
# 加载音频文件
audio_path = 'path/to/audio/file.wav'
audio, sr = librosa.load(audio_path)
# 提取音频振幅信息
amplitude = librosa.amplitude_to_db(librosa.stft(audio), ref=np.max)
# 绘制振幅图
plt.figure(figsize=(12, 4))
ax = plt.gca()
librosa.display.specshow(amplitude, sr=sr, x_axis='time', y_axis='log', ax=ax)
plt.colorbar(format='%+2.0f dB')
plt.title('振幅图')
plt.xlabel('时间 (秒)')
plt.ylabel('频率 (Hz)')
plt.tight_layout()
# 在指定的时间段上添加标记
time_ranges = [(2.0, 4.0), (5.0, 7.0), (8.0, 10.0)] # 指定的时间段,单位为秒
freq_range = (10, sr/2) # 定义频率范围
for start, end in time_ranges:
rect = Rectangle((start, freq_range[0]), end - start, freq_range[1] - freq_range[0],
linewidth=1, edgecolor='r', facecolor='
python绘制音量图
于 2023-10-07 15:50:09 首次发布