开发实时音频示波器与频率响度显示的完整过程与代码解析

最新推荐文章于 2024-10-05 23:15:10 发布

Dean of NITSC

最新推荐文章于 2024-10-05 23:15:10 发布

阅读量795

点赞数 23

文章标签：音视频个人开发音频 python python3.11 开发语言

本文链接：https://blog.csdn.net/zwa20110606/article/details/142673309

版权

开发实时音频示波器与频率响度显示的完整过程与代码解析

在本文中，我将分享开发一个实时音频示波器以及频率和响度显示工具的过程。通过使用 Python 的 PyAudio 和 Matplotlib 库，我们可以实时录制音频，动态显示音频波形，并计算其主频率和响度值。这个项目不仅在音频处理领域具有实践意义，还可以帮助你进一步理解数字信号处理中的基础概念。

一、开发背景

实际的：刚上完初二物理“声现象”，就想着看能不能开发一个示波器，没想到还真成功了。
一本正经：音频处理是数字信号处理中的一个重要应用方向。无论是在录音、声音分析还是音乐制作中，实时音频波形的显示、频率检测和响度计算都是核心技术。在这个项目中，我们希望开发一个简易的工具，能实时显示从麦克风输入的音频信号波形，同时计算出当前音频的主频率和响度。这不仅能让我们更直观地理解音频信号的特性，还可以帮助调试和优化音频系统。

二、开发工具和技术栈

简单介绍博文
 GitHub项目地址

Python 3.x: 高级编程语言，简洁且强大，广泛用于科学计算和音频处理。
NumPy: 处理音频信号的数组和数学运算库。
Matplotlib: 用于实时绘制音频波形。
PyAudio: 实现音频采集和播放。

三、功能需求

实时录音：从麦克风获取实时音频数据。
音频波形显示：使用 Matplotlib 绘制音频波形，反映当前音频信号的幅度变化。
频率和响度计算：通过快速傅里叶变换（FFT）计算音频的主频率，同时根据音频信号的幅值计算响度。

四、代码实现

接下来，让我们逐步解析代码的实现部分。

1. 初始化音频输入

我们首先使用 PyAudio 库初始化音频输入设备。在这里，我们设置了音频的采样率为 44100 Hz，每次读取 1024 帧的音频数据：

import numpy as np
import matplotlib.pyplot as plt
import pyaudio

# 设置参数
CHUNK = 1024
RATE = 44100

# 初始化 PyAudio
p = pyaudio.PyAudio()

# 打开音频流
stream = p.open(format=pyaudio.paInt16, channels=1, rate=RATE, input=True, frames_per_buffer=CHUNK)

2. 绘制实时波形图

接下来，我们使用 Matplotlib 的 plt.ion() 函数开启交互模式，以支持实时更新图形。在图中，我们使用两个子图：一个用于显示音频波形，另一个用于显示实时计算的频率和响度。

plt.ion()
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(10, 8))

# 绘制波形图的初始线条
line, = ax1.plot(np.zeros(CHUNK), linewidth=0.5)
ax1.set_ylim(-32768, 32767)
ax1.set_title("实时示波器")
ax1.set_xlabel("样本")
ax1.set_ylabel("幅度")
plt.grid()

# 绘制频率和响度显示
freq_text = ax2.text(0.5, 0.5, '', fontsize=20, ha='center', va='center')
ax2.set_title("实时频率和响度")
ax2.axis('off')

3. 实时更新音频波形

在每次从音频流中读取数据后，我们会通过 update_plot 函数更新波形图。该函数会接收音频数据，并更新 Matplotlib 的绘图数据。

def update_plot(data):
    line.set_ydata(data)  # 更新波形数据
    plt.draw()            # 重绘图形
    plt.pause(0.01)       # 暂停短暂时间以刷新图形

4. 频率和响度的计算

在频率和响度计算方面，我们使用快速傅里叶变换（FFT）来提取音频的频率信息。FFT 将时域信号转换为频域信号，使我们可以找到信号中的主频率。同时，响度的计算通过 RMS（均方根）公式，结果以分贝（dB）为单位表示。

def compute_frequency_and_loudness(data):
    # 计算 FFT
    fft_data = np.fft.fft(data)
    freq = np.fft.fftfreq(len(data), 1/RATE)
    
    # 计算响度（以 dB 表示）
    loudness = 20 * np.log10(np.sqrt(np.mean(data**2)) / 1)  # 使用 1 作为参考幅度
    
    # 找到最大频率
    peak_freq = np.abs(freq[np.argmax(np.abs(fft_data))])
    return peak_freq, loudness

5. 主循环与异常处理

主循环中，程序会不断从音频流读取数据，更新图形并计算频率和响度。当用户通过键盘中断（如 Ctrl+C）时，程序会捕获异常，清理资源并安全退出。

print("开始实时录音...")

try:
    while True:
        # 读取音频数据
        data = stream.read(CHUNK)
        audio_data = np.frombuffer(data, dtype=np.int16)
        
        # 更新图形
        update_plot(audio_data)

        # 计算频率和响度
        peak_freq, loudness = compute_frequency_and_loudness(audio_data)
        freq_text.set_text(f"频率: {peak_freq:.2f} Hz\n响度: {loudness:.2f}")

except KeyboardInterrupt:
    print("停止录音...")
finally:
    # 清理资源
    stream.stop_stream()
    stream.close()
    p.terminate()
    plt.ioff()
    plt.show()

6. 程序清理

为了确保程序在中断后能正确释放资源，我们使用了 try...except 结构捕获 KeyboardInterrupt 异常，并在 finally 块中终止音频流和绘图。

五、项目心得

通过这个项目，我们将 PyAudio 和 Matplotlib 结合在一起，成功实现了一个简易的实时音频分析工具。开发过程中，最具挑战的部分在于实时数据处理和绘图的性能优化。虽然 Python 的性能不如 C++ 等底层语言，但对于中小规模的实时处理需求，Python 完全能够胜任。对于更复杂的音频处理需求，可以考虑将 FFT 等计算任务移交给 C/C++ 编写的库，以提高效率。