Android 音视频开发(二)：使用 AudioRecord 采集音频PCM并保存到文件

最新推荐文章于 2024-05-21 10:10:35 发布

无崖

最新推荐文章于 2024-05-21 10:10:35 发布

阅读量366

点赞数 1

分类专栏： android 源码

android 同时被 2 个专栏收录

11 篇文章 1 订阅

订阅专栏

源码

10 篇文章 0 订阅

订阅专栏

转自：http://www.cnblogs.com/renhui/p/7457321.html

一、AudioRecord API详解

AudioRecord是Android系统提供的用于实现录音的功能类。

要想了解这个类的具体的说明和用法，我们可以去看一下官方的文档：

　　AndioRecord类的主要功能是让各种JAVA应用能够管理音频资源，以便它们通过此类能够录制声音相关的硬件所收集的声音。此功能的实现就是通过”pulling”（读取）AudioRecord对象的声音数据来完成的。在录音过程中，应用所需要做的就是通过后面三个类方法中的一个去及时地获取AudioRecord对象的录音数据. AudioRecord类提供的三个获取声音数据的方法分别是read(byte[], int, int), read(short[], int, int), read(ByteBuffer, int). 无论选择使用那一个方法都必须事先设定方便用户的声音数据的存储格式。

　　开始录音的时候，AudioRecord需要初始化一个相关联的声音buffer, 这个buffer主要是用来保存新的声音数据。这个buffer的大小，我们可以在对象构造期间去指定。它表明一个AudioRecord对象还没有被读取（同步）声音数据前能录多长的音(即一次可以录制的声音容量)。声音数据从音频硬件中被读出，数据大小不超过整个录音数据的大小（可以分多次读出），即每次读取初始化buffer容量的数据。

实现Android录音的流程为：

构造一个AudioRecord对象，其中需要的最小录音缓存buffer大小可以通过getMinBufferSize方法得到。如果buffer容量过小，将导致对象构造的失败。
初始化一个buffer，该buffer大于等于AudioRecord对象用于写声音数据的buffer大小。
开始录音
创建一个数据流，一边从AudioRecord中读取声音数据到初始化的buffer，一边将buffer中数据导入数据流。
关闭数据流
停止录音

二、使用 AudioRecord 实现录音，并生成wav

2.1 创建一个AudioRecord对象

首先要声明一些全局的变量参数：

private AudioRecord audioRecord = null;  // 声明 AudioRecord 对象
private int recordBufSize = 0; // 声明recoordBufffer的大小字段

获取buffer的大小并创建AudioRecord：

public void createAudioRecord() {
　　recordBufSize = AudioRecord.getMinBufferSize(frequency, channelConfiguration, EncodingBitRate);  //audioRecord能接受的最小的buffer大小
   audioRecord = new AudioRecord(MediaRecorder.AudioSource.MIC, frequency, channelConfiguration, EncodingBitRate, recordBufSize);
}

2.2 初始化一个buffer

byte data[] = new byte[recordBufSize];

2.3 开始录音

audioRecord.startRecording();

isRecording = true;

2.4 创建一个数据流，一边从AudioRecord中读取声音数据到初始化的buffer，一边将buffer中数据导入数据流。

FileOutputStream os = null;

try {
os = new FileOutputStream(filename);
} catch (FileNotFoundException e) {
e.printStackTrace();
}

if (null != os) {
    while (isRecording) {
        read = audioRecord.read(data, 0, recordBufSize);
　　　　  // 如果读取音频数据没有出现错误，就将数据写入到文件
        if (AudioRecord.ERROR_INVALID_OPERATION != read) {
            try {
                os.write(data);
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }

    try {
        os.close();
    } catch (IOException e) {
        e.printStackTrace();
    }
}

2.5 关闭数据流

修改标志位：isRecording 为false，上面的while循环就自动停止了，数据流也就停止流动了，Stream也就被关闭了。

isRecording = false;

2.6 停止录音

停止录音之后，注意要释放资源。

if (null != audioRecord) {
　　audioRecord.stop();
   audioRecord.release();
　　audioRecord = null;
   recordingThread = null;
}

注：权限需求：WRITE_EXTERNAL_STORAGE、RECORD_AUDIO

到现在基本的录音的流程就介绍完了。但是这时候，有人就提出问题来了：

1)、我按照流程，把音频数据都输出到文件里面了，停止录音后，打开此文件，发现不能播放，到底是为什么呢？

答：按照流程走完了，数据是进去了，但是现在的文件里面的内容仅仅是最原始的音频数据，术语称为raw（中文解释是“原材料”或“未经处理的东西”），这时候，你让播放器去打开，它既不知道保存的格式是什么，又不知道如何进行解码操作。当然播放不了。

2)、那如何才能在播放器中播放我录制的内容呢？

答：在文件的数据开头加入WAVE HEAD数据即可，也就是文件头。只有加上文件头部的数据，播放器才能正确的知道里面的内容到底是什么，进而能够正常的解析并播放里面的内容。具体的头文件的描述，在Play a WAV file on an AudioTrack里面可以进行了解。

添加WAVE文件头的代码如下：

public class PcmToWavUtil {
</span><span style="color: #008000;">/**</span><span style="color: #008000;">
 * 缓存的音频大小
 </span><span style="color: #008000;">*/</span>
<span style="color: #0000ff;">private</span> <span style="color: #0000ff;">int</span><span style="color: #000000;"> mBufferSize;
</span><span style="color: #008000;">/**</span><span style="color: #008000;">
 * 采样率
 </span><span style="color: #008000;">*/</span>
<span style="color: #0000ff;">private</span> <span style="color: #0000ff;">int</span><span style="color: #000000;"> mSampleRate;
</span><span style="color: #008000;">/**</span><span style="color: #008000;">
 * 声道数
 </span><span style="color: #008000;">*/</span>
<span style="color: #0000ff;">private</span> <span style="color: #0000ff;">int</span><span style="color: #000000;"> mChannel;


</span><span style="color: #008000;">/**</span><span style="color: #008000;">
 * </span><span style="color: #808080;">@param</span><span style="color: #008000;"> sampleRate sample rate、采样率
 * </span><span style="color: #808080;">@param</span><span style="color: #008000;"> channel channel、声道
 * </span><span style="color: #808080;">@param</span><span style="color: #008000;"> encoding Audio data format、音频格式
 </span><span style="color: #008000;">*/</span><span style="color: #000000;">
PcmToWavUtil(</span><span style="color: #0000ff;">int</span> sampleRate, <span style="color: #0000ff;">int</span> channel, <span style="color: #0000ff;">int</span><span style="color: #000000;"> encoding) {
    </span><span style="color: #0000ff;">this</span>.mSampleRate =<span style="color: #000000;"> sampleRate;
    </span><span style="color: #0000ff;">this</span>.mChannel =<span style="color: #000000;"> channel;
    </span><span style="color: #0000ff;">this</span>.mBufferSize =<span style="color: #000000;"> AudioRecord.getMinBufferSize(mSampleRate, mChannel, encoding);
}


</span><span style="color: #008000;">/**</span><span style="color: #008000;">
 * pcm文件转wav文件
 *
 * </span><span style="color: #808080;">@param</span><span style="color: #008000;"> inFilename 源文件路径
 * </span><span style="color: #808080;">@param</span><span style="color: #008000;"> outFilename 目标文件路径
 </span><span style="color: #008000;">*/</span>
<span style="color: #0000ff;">public</span> <span style="color: #0000ff;">void</span><span style="color: #000000;"> pcmToWav(String inFilename, String outFilename) {
    FileInputStream in;
    FileOutputStream out;
    </span><span style="color: #0000ff;">long</span><span style="color: #000000;"> totalAudioLen;
    </span><span style="color: #0000ff;">long</span><span style="color: #000000;"> totalDataLen;
    </span><span style="color: #0000ff;">long</span> longSampleRate =<span style="color: #000000;"> mSampleRate;
    </span><span style="color: #0000ff;">int</span> channels = mChannel == AudioFormat.CHANNEL_IN_MONO ? 1 : 2<span style="color: #000000;">;
    </span><span style="color: #0000ff;">long</span> byteRate = 16 * mSampleRate * channels / 8<span style="color: #000000;">;
    </span><span style="color: #0000ff;">byte</span>[] data = <span style="color: #0000ff;">new</span> <span style="color: #0000ff;">byte</span><span style="color: #000000;">[mBufferSize];
    </span><span style="color: #0000ff;">try</span><span style="color: #000000;"> {
        in </span>= <span style="color: #0000ff;">new</span><span style="color: #000000;"> FileInputStream(inFilename);
        out </span>= <span style="color: #0000ff;">new</span><span style="color: #000000;"> FileOutputStream(outFilename);
        totalAudioLen </span>=<span style="color: #000000;"> in.getChannel().size();
        totalDataLen </span>= totalAudioLen + 36<span style="color: #000000;">;

        writeWaveFileHeader(out, totalAudioLen, totalDataLen,
            longSampleRate, channels, byteRate);
        </span><span style="color: #0000ff;">while</span> (in.read(data) != -1<span style="color: #000000;">) {
            out.write(data);
        }
        in.close();
        out.close();
    } </span><span style="color: #0000ff;">catch</span><span style="color: #000000;"> (IOException e) {
        e.printStackTrace();
    }
}


</span><span style="color: #008000;">/**</span><span style="color: #008000;">
 * 加入wav文件头
 </span><span style="color: #008000;">*/</span>
<span style="color: #0000ff;">private</span> <span style="color: #0000ff;">void</span> writeWaveFileHeader(FileOutputStream out, <span style="color: #0000ff;">long</span><span style="color: #000000;"> totalAudioLen,
                                 </span><span style="color: #0000ff;">long</span> totalDataLen, <span style="color: #0000ff;">long</span> longSampleRate, <span style="color: #0000ff;">int</span> channels, <span style="color: #0000ff;">long</span><span style="color: #000000;"> byteRate)
    </span><span style="color: #0000ff;">throws</span><span style="color: #000000;"> IOException {
    </span><span style="color: #0000ff;">byte</span>[] header = <span style="color: #0000ff;">new</span> <span style="color: #0000ff;">byte</span>[44<span style="color: #000000;">];
    </span><span style="color: #008000;">//</span><span style="color: #008000;"> RIFF/WAVE header</span>
    header[0] = 'R'<span style="color: #000000;">;
    header[</span>1] = 'I'<span style="color: #000000;">;
    header[</span>2] = 'F'<span style="color: #000000;">;
    header[</span>3] = 'F'<span style="color: #000000;">;
    header[</span>4] = (<span style="color: #0000ff;">byte</span>) (totalDataLen &amp; 0xff<span style="color: #000000;">);
    header[</span>5] = (<span style="color: #0000ff;">byte</span>) ((totalDataLen &gt;&gt; 8) &amp; 0xff<span style="color: #000000;">);
    header[</span>6] = (<span style="color: #0000ff;">byte</span>) ((totalDataLen &gt;&gt; 16) &amp; 0xff<span style="color: #000000;">);
    header[</span>7] = (<span style="color: #0000ff;">byte</span>) ((totalDataLen &gt;&gt; 24) &amp; 0xff<span style="color: #000000;">);
    </span><span style="color: #008000;">//</span><span style="color: #008000;">WAVE</span>
    header[8] = 'W'<span style="color: #000000;">;
    header[</span>9] = 'A'<span style="color: #000000;">;
    header[</span>10] = 'V'<span style="color: #000000;">;
    header[</span>11] = 'E'<span style="color: #000000;">;
    </span><span style="color: #008000;">//</span><span style="color: #008000;"> 'fmt ' chunk</span>
    header[12] = 'f'<span style="color: #000000;">;
    header[</span>13] = 'm'<span style="color: #000000;">;
    header[</span>14] = 't'<span style="color: #000000;">;
    header[</span>15] = ' '<span style="color: #000000;">;
    </span><span style="color: #008000;">//</span><span style="color: #008000;"> 4 bytes: size of 'fmt ' chunk</span>
    header[16] = 16<span style="color: #000000;">;
    header[</span>17] = 0<span style="color: #000000;">;
    header[</span>18] = 0<span style="color: #000000;">;
    header[</span>19] = 0<span style="color: #000000;">;
    </span><span style="color: #008000;">//</span><span style="color: #008000;"> format = 1</span>
    header[20] = 1<span style="color: #000000;">;
    header[</span>21] = 0<span style="color: #000000;">;
    header[</span>22] = (<span style="color: #0000ff;">byte</span><span style="color: #000000;">) channels;
    header[</span>23] = 0<span style="color: #000000;">;
    header[</span>24] = (<span style="color: #0000ff;">byte</span>) (longSampleRate &amp; 0xff<span style="color: #000000;">);
    header[</span>25] = (<span style="color: #0000ff;">byte</span>) ((longSampleRate &gt;&gt; 8) &amp; 0xff<span style="color: #000000;">);
    header[</span>26] = (<span style="color: #0000ff;">byte</span>) ((longSampleRate &gt;&gt; 16) &amp; 0xff<span style="color: #000000;">);
    header[</span>27] = (<span style="color: #0000ff;">byte</span>) ((longSampleRate &gt;&gt; 24) &amp; 0xff<span style="color: #000000;">);
    header[</span>28] = (<span style="color: #0000ff;">byte</span>) (byteRate &amp; 0xff<span style="color: #000000;">);
    header[</span>29] = (<span style="color: #0000ff;">byte</span>) ((byteRate &gt;&gt; 8) &amp; 0xff<span style="color: #000000;">);
    header[</span>30] = (<span style="color: #0000ff;">byte</span>) ((byteRate &gt;&gt; 16) &amp; 0xff<span style="color: #000000;">);
    header[</span>31] = (<span style="color: #0000ff;">byte</span>) ((byteRate &gt;&gt; 24) &amp; 0xff<span style="color: #000000;">);
    </span><span style="color: #008000;">//</span><span style="color: #008000;"> block align</span>
    header[32] = (<span style="color: #0000ff;">byte</span>) (2 * 16 / 8<span style="color: #000000;">);
    header[</span>33] = 0<span style="color: #000000;">;
    </span><span style="color: #008000;">//</span><span style="color: #008000;"> bits per sample</span>
    header[34] = 16<span style="color: #000000;">;
    header[</span>35] = 0<span style="color: #000000;">;
    </span><span style="color: #008000;">//</span><span style="color: #008000;">data</span>
    header[36] = 'd'<span style="color: #000000;">;
    header[</span>37] = 'a'<span style="color: #000000;">;
    header[</span>38] = 't'<span style="color: #000000;">;
    header[</span>39] = 'a'<span style="color: #000000;">;
    header[</span>40] = (<span style="color: #0000ff;">byte</span>) (totalAudioLen &amp; 0xff<span style="color: #000000;">);
    header[</span>41] = (<span style="color: #0000ff;">byte</span>) ((totalAudioLen &gt;&gt; 8) &amp; 0xff<span style="color: #000000;">);
    header[</span>42] = (<span style="color: #0000ff;">byte</span>) ((totalAudioLen &gt;&gt; 16) &amp; 0xff<span style="color: #000000;">);
    header[</span>43] = (<span style="color: #0000ff;">byte</span>) ((totalAudioLen &gt;&gt; 24) &amp; 0xff<span style="color: #000000;">);
    out.write(header, </span>0, 44<span style="color: #000000;">);
}

}

三、附言

Android SDK 提供了两套音频采集的API，分别是：MediaRecorder 和 AudioRecord，前者是一个更加上层一点的API，它可以直接把手机麦克风录入的音频数据进行编码压缩（如AMR、MP3等）并存成文件，而后者则更接近底层，能够更加自由灵活地控制，可以得到原始的一帧帧PCM音频数据。如果想简单地做一个录音机，录制成音频文件，则推荐使用 MediaRecorder，而如果需要对音频做进一步的算法处理、或者采用第三方的编码库进行压缩、以及网络传输等应用，则建议使用 AudioRecord，其实 MediaRecorder 底层也是调用了 AudioRecord 与 Android Framework 层的 AudioFlinger 进行交互的。直播中实时采集音频自然是要用AudioRecord了。

四、源码

https://github.com/renhui/AudioDemo

无崖

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Android 音视频开发(二)：使用 AudioRecord 采集音频PCM并保存到文件

转自：http://www.cnblogs.com/renhui/p/7457321.html一、AudioRecord API详解AudioRecord是Android系统提供的用于实现录音的功能类。要想了解这个类的具体的说明和用法，我们可以去看一下官方的文档：　　AndioRecord类的主要功能是让各种JAVA应用能够管理音频资源，以便它们通过此类能够录制声音相关的硬件所收集...
复制链接

扫一扫

专栏目录