在ffmpeg,音频数据会保存在AVFrame中extended_data数组中,如果是打包模式(packed),就只用extended_data[0];如果是planar模式,则每个channel分别保存在extended_data[i]中。对于音频,只有linesize[0]有效,打包模式保存整个音频帧的buff大小,planar模式保存每个channel的buff大小。
ffmpeg中对两种模式(planar和packed)的说明(在samplefmt.h中有详细说明):
* For planar sample formats, each audio channel is in a separate data plane,
* and linesize is the buffer size, in bytes, for a single plane. All data
* planes must be the same size. For packed sample formats, only the first data
* plane is used, and samples for each channel are interleaved. In this case,
* linesize is the buffer size, in bytes, for the 1 plane.
下面的例子是从解码后得到的AVframe中,取出AV_SAMPLE_FMT_FLTP格式、2声道数据的方法
// 得到该种格式数据一个buffer所需的空间大小
int data_size =av_samples_get_buffer_size(pFrame->linesize,decode_audioCodecCtx->channels,pFrame->nb_samples,AV_SAMPLE_FMT_FLTP, 0);
uint8_t *data = (uint8_t *)malloc(data_size);
memset(data, 0, data_size);
uint8_t *sample_buffer_L = pFrame->extended_data[0];//存放着左声道的数据
uint8_t *sample_buffer_R = pFrame->extended_data[1];//存放着右声道的数据</span></span>
两者都是16bit,而裸的PCM文件里的数据是按照 LRLRLRLR 这样存储的,所以我们需要按照这种格式存储16bit的数据:
for(int i = 0, j = 0; i < data_size; i += 4, j++){
data[i] = sample_buffer_L[j] & 0xff;//左声道低8位
data[i+1] = (sample_buffer_L[j]>>8) & 0xff;//左声道高8位
data[i+2] = sample_buffer_R[j] & 0xff;//右声道低8位
data[i+3] = (sample_buffer_R[j]>>8) & 0xff;//右声道高8位
}