关于 AudioRecord
Android SDK 提供了两套音频采集的API,分别是:MediaRecorder 和 AudioRecord,前者是一个更加上层一点的API,它可以直接把手机麦克风录入的音频数据进行编码压缩(如AMR、MP3等)并存成文件,而后者则更接近底层,能够更加自由灵活地控制,可以得到原始的一帧帧PCM音频数据。
如果想简单地做一个录音机,录制成音频文件,则推荐使用 MediaRecorder,而如果需要对音频做进一步的算法处理、或者采用第三方的编码库进行压缩、以及网络传输等应用,则建议使用 AudioRecord,其实 MediaRecorder 底层也是调用了 AudioRecord 与 Android Framework 层的 AudioFlinger 进行交互的。
音频的开发,更广泛地应用不仅仅局限于本地录音,因此,我们需要重点掌握如何利用更加底层的 AudioRecord API 来采集音频数据(注意,使用它采集到的音频数据是原始的PCM格式,想压缩为mp3,aac等格式的话,还需要专门调用编码器进行编码)。
AudioRecord 的参数配置
-
audioSource:音频采集的输入源
可选的值以常量的形式定义在 MediaRecorder.AudioSource 类中,常用的值包括:
- 1. DEFAULT (默认)
- 2. VOICE_RECOGNITION (用于语音识别,等同于 DEFAULT )
- 3. MIC (由手机麦克风输入)
- 4. VOICE_COMMUNICATION (用于 VoIP 应用)等等
-
sampleRateInHz: 采样率
目前 44100Hz 是唯一可以保证兼容所有 Android 手机的采样率。
-
channelConfig: 通道数
可选的值以常量的形式定义在 AudioFormat 类中,常用的是
- 1. CHANNEL_IN_MONO (单通道)
- 2. CHANNEL_IN_STEREO(双通道)
-
audioFormat: 数据位宽
可选的值以常量的形式定义在 AudioFormat 类中,常用的是( 1 是可以保证兼容所有Android手机的)
- 1. ENCODING_PCM_16BIT(16bit)
- 2. ENCODING_PCM_8BIT(8bit)
-
bufferSizeInBytes:AudioRecord 内部的音频缓冲区的大小
该缓冲区的值不能低于一帧“音频帧”(Frame)的大小:
int size = 采样率 x 位宽 x 采样时间 x 通道数
采样时间一般取 2.5ms~120ms 之间,由厂商或者具体的应用决定,我们其实可以推断,每一帧的采样时间取得越短,产生的延时就应该会越小,当然,碎片化的数据也就会越多。
在Android开发中,AudioRecord 类提供了一个帮助你确定这个 bufferSizeInBytes 的函数,原型如下:
int getMinBufferSize(int sampleRateInHz, int channelConfig, int audioFo