借用PortAudio采集和播放音频，实现一个双路混音器

最新推荐文章于 2024-04-25 16:00:32 发布

chinabinlang

最新推荐文章于 2024-04-25 16:00:32 发布

阅读量3.3k

点赞数

分类专栏： PortAudio

PortAudio 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

借用PortAudio采集和播放音频，实现一个双路混音器

　　混音，顾名思义，就是把多个音源混合的过程，是一个很常见的应用。这两天我也做了一个双路混音器，当然，我没有做多么专业的音频信号处理，只是一个简单的混音，调节各路音量，并实现了一些音效处理。主要功能有：采集硬件设备，读取wav文件，播放，混音，音量调节，音频节奏、音调的调节，wav文件输出。这么多功能，我们不需要一个一个全部自己实现，有时候，借助开源项目，尤其是比较成熟的开源项目，不但可以大大节省开发时间，还能使程序更加稳定。即便不能直接在自己的项目中使用，也能有借鉴意义。这个项目中我就使用了PortAudio，PortAudio是一个开源的、跨平台的音频IO库，它主要提供了音频采集和播放的接口，而且API非常简单。大家可以尝试一下。

　　下图就是该项目产品截图：

　　所有的功能呢，在界面上是一目了然了，其中有三个子窗口，是音频数据经FFT（快速傅立叶）变换后显示的频谱图，左右两个分别是两路音频的，中间则是混音后的。这里我和大家分享一下这个混音器的设计思路以及PortAudio的使用，希望有需求的朋友能够有所借鉴。

首先是程序的逻辑架构图

　　PortAudio在项目中主要负责采集硬件设备和播放内存中的音频Sample，其实在Windows上实现这种功能可以有多种方法，之前我也基于DirectShow做过，这次使用PortAudio主要也是想熟悉一下，将来如果要做其他平台的应用时，可以直接拿来使用了。

AudioInput的主要功能是封装一下音频的输入，包括硬件采集和文件读取
AudioMixer管理AudioInput，并进行音量和各种音效处理
鉴于文件操作比较费时，FileWritter的操作其实是放在单独的线程中进行的。

PortAudio的封装和使用

　　PortAudio的API非常的简单，基本上完成采集或播放的功能，只需要调用三个接口就可以了：Pa_OpenStream, Pa_StartStream, Pa_CloseStream。它们的原型如下

　　首先，我们需要调用Pa_Initialize来进行PortAudio的初始化，然后设置好Pa_OpenStream的各项参数，然后就可以使用它了。调用Pa_StartStream之后，如果是采集，就可以从PortAudio读取数据了，如果是播放，则只需要不断的把要播放的音频数据交给PortAudio就行了。而PortAudio和你的程序之间的数据的交互，其实是有两种方式的，一种就是上面原型中提到的设置回调函数的形式，另一种就是调用Pa_ReadStream和Pa_WriteStream这两个函数，我推荐还是通过回调的形式，简单嘛，这个最重要了:)。回调函数的原型也比较简单，采集和播放都是一样的。

　　我们只需要在回调函数中操作inputBuffer或者outputBuffer即可，下面是我启动前进行设置的代码：

1. PortAudio的采集

2. PortAudio的播放

　　有一点需要注意的是，framesPerBuffer的值，也就是在Pa_OpenStream中设置的参数值，这个数值就是outputBuffer或inputBuffer中音频帧的个数，我这里设置成了512，当然你也可以设置成其他的数值，不过不宜过小，否则会造成大量的异步回调，cpu是处理不过来的。这个数值再乘以你之前这只的音频帧Sample格式（我这里是paFloat32）和音轨个数，就可以计算出outputBuffer或inputBuffer的大小，然后就可以操作音频数据了，例如在采集的回调函数中这样使用。

memcpy(audio_data, inputBuffer, framesPerBuffer * sizeof(float)*2);

混音算法

　　实话实说，这个混音算法是我从网上找到的，不过效果还是挺不错的，公式就是

C = A + B - (A * B >> 0x10)

　　A和B就是两路不同的音频数据，C就是混音后的音频数据，当然，处理后，还需要对C进行防止数据溢出的处理，否则，可能会有爆音。

如果是16bit音频数据，就是：

if (C > 32767) C = 32767;
else if (C < -32768) C = -32768;

如果是float音频数据，就是：

if (C > 1) C = 1;
else if (C < -1) C = -1;

　　这个算法针对的是16bit的音频采样数据，我实验的结果是：对float音频采样数据，同样有不错的效果。

chinabinlang

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录