实验6 | MPEG音频编码

weixin_48462511

于 2021-06-17 00:03:48 发布

阅读量284

点赞数

分类专栏：数据压缩作业

本文链接：https://blog.csdn.net/weixin_48462511/article/details/117960214

版权

数据压缩作业专栏收录该内容

12 篇文章 0 订阅

订阅专栏

一、MPEG-1 Audio LayerII编码器原理

在这里插入图片描述

1、多相滤波器组：将PCM样本变换到32个子带的频域信号

如果输入的采样频率为48kHz，那么子带的频率宽度为48/（2*32）=0.75Hz
在这里插入图片描述
缺点：
（1）等带宽的滤波器组与人类听觉系统的临界频带不对应
在低频区域，单个子带会覆盖多个临界频带。在这种情况下，量化比特数不能兼每个临界频带
（2）滤波器组与其逆过程不是无失真的
但滤波器组引入的误差差很小，且听不到
（3）子带间频率有混叠
滤波后的相邻子带有频率混叠现象，一个子带中的信号可以影响相邻子带的输出

2、心理声学模型：计算信号中不可听觉感知的部分

计算噪声遮蔽效应
（1）心理声学模型1:计算复杂度低，但对假设用户听不到的部分压缩太严重
（2）心理声学模型2 :提供了适合Layer III编码的更多特征
实际实现的模型复杂度取决所需要的压缩因子

3、比特分配器：根据心理声学模型的计算结果，为每个子带信号分配比特数

4、装帧：产生MPEG-I兼容的比特流

二、感知音频编码的设计思想

感知编码是利用人耳听觉的心理声学特性，将凡是人耳感觉不到的成分不编码不传送的一种编码技术。

1、绝对听觉门限

声源振动的能量通过声波传入人耳，使耳膜发生振动，人们就产生了声音的感觉。但是人耳能听到的振动频率约在20Hz到20KHz之间，低于20Hz或高于20KHz的振动，不能引起人类听觉器官的感觉。心理声学模型中一个基本的概念就是听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号就听不到，因此就可以把这部分信号去掉。听觉阈值的大小随声音频率的改变而改变，各个人的听觉阈值也不同。一个人是否能听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值。

2、听觉掩蔽效应

一种频率的声音阻碍听觉系统感受另一种频率的声音的现象称为掩蔽效应。掩蔽可分成频域掩蔽和时域掩蔽。

（1）频域掩蔽

频域掩蔽是指掩蔽声与被掩蔽声同时作用时发生掩蔽效应，是一种较强的掩蔽效应。通常，频域中的一个强音会掩蔽与之同时发声的附近的弱音，弱音离强音越近，一般越容易被掩蔽。一般来说，低频的音容易掩蔽高频的音；在距离强音较远处，绝对听觉门限比该强音所引起的掩蔽阈值高，这时噪声的掩蔽阈值应取绝对听觉门限。

（2）时域掩蔽

在时间上相邻的声音之间产生的掩蔽现象称为时域掩蔽，即掩蔽效应发生在掩蔽声与被掩蔽声不同时出现。若掩蔽声音出现之前的一段时间内发生掩蔽效应，则称为导前掩蔽；否则称为滞后掩蔽。产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间，异时掩蔽也随着时间的推移很快会衰减，是一种弱掩蔽效应。

3、感知编/解码器

利用人耳的心理声学特性，可以设计相应的模块去除一些冗余信息，提高数据的压缩效率。
在这里插入图片描述

三、心理声学模型的实现过程

1、临界频带

由于声音频率与掩蔽曲线不是线性关系，为从感知上来统一度量声音频率，引入了 “临界频带”的概念。当某个纯音被以它为中心频率、且具有一定带宽的连续噪声所掩蔽时，如果该纯音刚好被听到时的功率等于这一频带内的噪声功率，这个带宽为临界频带宽度。通常认为，在20Hz到16kHz范围内有24个临界频带。

2、掩蔽值的计算

在这里插入图片描述

四、码率分配的实现思路

1、在调整到固定的码率之前

先确定可用于样值编码的有效比特数，这个数值取决于比例因子、比例因子选择信息、比特分配信息以及辅助数据所需比特数

2、比特分配的过程

（1）对每个子带计算掩蔽-噪声比MNR，是信噪比SNR–信掩比SMR，即：MNR = SNR–SMR
（2）NMR=SMR-SNR

3、算法：使整帧和每个子带的总噪声—掩蔽比最小

（1）计算噪声-掩蔽比( NMR)： NMR = SMR – SNR (dB)
其中SNR 由MPEG-I标准给定 (为量化水平的函数) NMR：表示波形误差与感知测量之间的误差
（2）循环，直到没有比特可用
◼ NMR = SMR– SNR (dB)
◼ 对最高NMR的子带分配比特，使获益最大的子带的量化级别增加一级
◼ 重新计算分配了更多比特子带的NMR
在这里插入图片描述

五、程序设计

main函数主要作用：
1、过滤数据滑动窗口以获取 32 个子波段，即每个通道的样本
2、如果采用联合立体声模式，则将左右通道组合在一起
3、计算一帧的比例因子和比例因素选择信息
4、使用选定的心理声学模型计算心理声学掩蔽水平
5、使用第4步的掩蔽电平对低掩蔽比的子带执行迭转位分配
6、如果错误保护标志处于活动状态，则添加CRC纠错
7、将比特分配，比例因子和比例因子信息打包到比特流中
8、量化子带并将其打包到比特流中

int main (int argc, char **argv)
{
  typedef double SBS[2][3][SCALE_BLOCK][SBLIMIT];
  SBS *sb_sample;
  typedef double JSBS[3][SCALE_BLOCK][SBLIMIT];
  JSBS *j_sample;
  typedef double IN[2][HAN_SIZE];
  IN *win_que;
  typedef unsigned int SUB[2][3][SCALE_BLOCK][SBLIMIT];
  SUB *subband;

  frame_info frame;  //结构体，包含头信息、比特分配表、声道数等内容
  frame_header header;  //头信息
  char original_file_name[MAX_NAME_SIZE];  //输入文件名
  char encoded_file_name[MAX_NAME_SIZE];  //输出文件名
  short **win_buf;
  static short buffer[2][1152];
  static unsigned int bit_alloc[2][SBLIMIT], scfsi[2][SBLIMIT];  //存放2声道共32个子带的比特分配表
  static unsigned int scalar[2][3][SBLIMIT], j_scale[3][SBLIMIT];  //存放2声道、3组各子带的比例因子
  static double smr[2][SBLIMIT], lgmin[2][SBLIMIT], max_sc[2][SBLIMIT];
  // FLOAT snr32[32];
  short sam[2][1344];		/* was [1056]; */
  int model, nch, error_protection;
  static unsigned int crc;
  int sb, ch, adb;
  unsigned long frameBits, sentBits = 0;
  unsigned long num_samples;
  int lg_frame;
  int i;

  /* Used to keep the SNR values for the fast/quick psy models */
  static FLOAT smrdef[2][32];

  static int psycount = 0;
  extern int minimum;

  time_t start_time, end_time;
  int total_time;

  sb_sample = (SBS *) mem_alloc (sizeof (SBS), "sb_sample");
  j_sample = (JSBS *) mem_alloc (sizeof (JSBS), "j_sample");
  win_que = (IN *) mem_alloc (sizeof (IN), "Win_que");
  subband = (SUB *) mem_alloc (sizeof (SUB), "subband");
  win_buf = (short **) mem_alloc (sizeof (short *) * 2, "win_buf");

  /* clear buffers */
  memset ((char *) buffer, 0, sizeof (buffer));
  memset ((char *) bit_alloc, 0, sizeof (bit_alloc));
  memset ((char *) scalar, 0, sizeof (scalar));
  memset ((char *) j_scale, 0, sizeof (j_scale));
  memset ((char *) scfsi, 0, sizeof (scfsi));
  memset ((char *) smr, 0, sizeof (smr));
  memset ((char *) lgmin, 0, sizeof (lgmin));
  memset ((char *) max_sc, 0, sizeof (max_sc));
  //memset ((char *) snr32, 0, sizeof (snr32));
  memset ((char *) sam, 0, sizeof (sam));

  global_init ();  //全局初始化
  
  header.extension = 0;
  frame.header = &header;
  frame.tab_num = -1;		/* no table loaded */
  frame.alloc = NULL;
  header.version = MPEG_AUDIO_ID;	/* Default: MPEG-1 */

  total_time = 0;

  time(&start_time);     

  programName = argv[0];
  if (argc == 1)		/* no command-line args */
    short_usage ();
  else
    parse_args (argc, argv, &frame, &model, &num_samples, original_file_name,
		encoded_file_name);  //解析命令行参数
  print_config (&frame, &model, original_file_name, encoded_file_name);  //输出配置信息

  /* this will load the alloc tables and do some other stuff */
  hdr_to_frps (&frame);  //加载从信息头中解压出来的信息
  nch = frame.nch;
  error_protection = header.error_protection;



  while (get_audio (musicin, buffer, num_samples, nch, &header) > 0) {  //获取每一帧的信息
    if (glopts.verbosity > 1)
      if (++frameNum % 10 == 0)
	fprintf (stderr, "[%4u]\r", frameNum);
    fflush (stderr);
    win_buf[0] = &buffer[0][0];
    win_buf[1] = &buffer[1][0];

    adb = available_bits (&header, &glopts);  //比特预算
    lg_frame = adb / 8;
    if (header.dab_extension) {
      /* in 24 kHz we always have 4 bytes */
      if (header.sampling_frequency == 1)
	header.dab_extension = 4;
/* You must have one frame in memory if you are in DAB mode                 */
/* in conformity of the norme ETS 300 401 http://www.etsi.org               */
      /* see bitstream.c            */
      if (frameNum == 1)
	minimum = lg_frame + MINIMUM;
      adb -= header.dab_extension * 8 + header.dab_length * 8 + 16;
    }

    {
      int gr, bl, ch;
      /* New polyphase filter
	 Combines windowing and filtering. Ricardo Feb'03 */
      for( gr = 0; gr < 3; gr++ )  //将36个样值分为3组
	for ( bl = 0; bl < 12; bl++ )  //每组做12次子带分解
	  for ( ch = 0; ch < nch; ch++ )
	    WindowFilterSubband( &buffer[ch][gr * 12 * 32 + 32 * bl], ch,
				 &(*sb_sample)[ch][gr][bl][0] );  //多相滤波器组
    }

#ifdef REFERENCECODE
    {
      /* Old code. left here for reference */
      int gr, bl, ch;
      for (gr = 0; gr < 3; gr++)
	for (bl = 0; bl < SCALE_BLOCK; bl++)
	  for (ch = 0; ch < nch; ch++) {
	    window_subband (&win_buf[ch], &(*win_que)[ch][0], ch);
	    filter_subband (&(*win_que)[ch][0], &(*sb_sample)[ch][gr][bl][0]);
	  }
    }
#endif


#ifdef NEWENCODE
    scalefactor_calc_new(*sb_sample, scalar, nch, frame.sblimit);  //计算比例因子
    find_sf_max (scalar, &frame, max_sc);
    if (frame.actual_mode == MPG_MD_JOINT_STEREO) {
      /* this way we calculate more mono than we need */
      /* but it is cheap */
      combine_LR_new (*sb_sample, *j_sample, frame.sblimit);
      scalefactor_calc_new (j_sample, &j_scale, 1, frame.sblimit);  //计算比例因子选择信息
    }
#else
    scale_factor_calc (*sb_sample, scalar, nch, frame.sblimit);
    pick_scale (scalar, &frame, max_sc);
    if (frame.actual_mode == MPG_MD_JOINT_STEREO) {
      /* this way we calculate more mono than we need */
      /* but it is cheap */
      combine_LR (*sb_sample, *j_sample, frame.sblimit);
      scale_factor_calc (j_sample, &j_scale, 1, frame.sblimit);
    }
#endif

    if ((glopts.quickmode == TRUE) && (++psycount % glopts.quickcount != 0)) {
      /* We're using quick mode, so we're only calculating the model every
         'quickcount' frames. Otherwise, just copy the old ones across */
      for (ch = 0; ch < nch; ch++) {
	for (sb = 0; sb < SBLIMIT; sb++)
	  smr[ch][sb] = smrdef[ch][sb];
      }
    } else {
      /* calculate the psymodel */
      //根据心理声学模型计算掩蔽电平
      switch (model) {
      case -1:
	psycho_n1 (smr, nch);
	break;
      case 0:	/* Psy Model A */
	psycho_0 (smr, nch, scalar, (FLOAT) s_freq[header.version][header.sampling_frequency] * 1000);	
	break;
      case 1:
	psycho_1 (buffer, max_sc, smr, &frame);
	break;
      case 2:
	for (ch = 0; ch < nch; ch++) {
	  psycho_2 (&buffer[ch][0], &sam[ch][0], ch, &smr[ch][0], //snr32,
		     (FLOAT) s_freq[header.version][header.sampling_frequency] *
		     1000, &glopts);
	}
	break;
      case 3:
	/* Modified psy model 1 */
	psycho_3 (buffer, max_sc, smr, &frame, &glopts);
	break;
      case 4:
	/* Modified Psycho Model 2 */
	for (ch = 0; ch < nch; ch++) {
	  psycho_4 (&buffer[ch][0], &sam[ch][0], ch, &smr[ch][0], // snr32,
		     (FLOAT) s_freq[header.version][header.sampling_frequency] *
		     1000, &glopts);
	}
	break;	
      case 5:
	/* Model 5 comparse model 1 and 3 */
	psycho_1 (buffer, max_sc, smr, &frame);
	fprintf(stdout,"1 ");
	smr_dump(smr,nch);
	psycho_3 (buffer, max_sc, smr, &frame, &glopts);
	fprintf(stdout,"3 ");
	smr_dump(smr,nch);
	break;
      case 6:
	/* Model 6 compares model 2 and 4 */
	for (ch = 0; ch < nch; ch++) 
	  psycho_2 (&buffer[ch][0], &sam[ch][0], ch, &smr[ch][0], //snr32,
		    (FLOAT) s_freq[header.version][header.sampling_frequency] *
		    1000, &glopts);
	fprintf(stdout,"2 ");
	smr_dump(smr,nch);
	for (ch = 0; ch < nch; ch++) 
	  psycho_4 (&buffer[ch][0], &sam[ch][0], ch, &smr[ch][0], // snr32,
		     (FLOAT) s_freq[header.version][header.sampling_frequency] *
		     1000, &glopts);
	fprintf(stdout,"4 ");
	smr_dump(smr,nch);
	break;
      case 7:
	fprintf(stdout,"Frame: %i\n",frameNum);
	/* Dump the SMRs for all models */	
	psycho_1 (buffer, max_sc, smr, &frame);
	fprintf(stdout,"1");
	smr_dump(smr, nch);
	psycho_3 (buffer, max_sc, smr, &frame, &glopts);
	fprintf(stdout,"3");
	smr_dump(smr,nch);
	for (ch = 0; ch < nch; ch++) 
	  psycho_2 (&buffer[ch][0], &sam[ch][0], ch, &smr[ch][0], //snr32,
		    (FLOAT) s_freq[header.version][header.sampling_frequency] *
		    1000, &glopts);
	fprintf(stdout,"2");
	smr_dump(smr,nch);
	for (ch = 0; ch < nch; ch++) 
	  psycho_4 (&buffer[ch][0], &sam[ch][0], ch, &smr[ch][0], // snr32,
		     (FLOAT) s_freq[header.version][header.sampling_frequency] *
		     1000, &glopts);
	fprintf(stdout,"4");
	smr_dump(smr,nch);
	break;
      case 8:
	/* Compare 0 and 4 */	
	psycho_n1 (smr, nch);
	fprintf(stdout,"0");
	smr_dump(smr,nch);

	for (ch = 0; ch < nch; ch++) 
	  psycho_4 (&buffer[ch][0], &sam[ch][0], ch, &smr[ch][0], // snr32,
		     (FLOAT) s_freq[header.version][header.sampling_frequency] *
		     1000, &glopts);
	fprintf(stdout,"4");
	smr_dump(smr,nch);
	break;
      default:
	fprintf (stderr, "Invalid psy model specification: %i\n", model);
	exit (0);
      }

      if (glopts.quickmode == TRUE)
	/* copy the smr values and reuse them later */
	for (ch = 0; ch < nch; ch++) {
	  for (sb = 0; sb < SBLIMIT; sb++)
	    smrdef[ch][sb] = smr[ch][sb];
	}

      if (glopts.verbosity > 4) 
	smr_dump(smr, nch);
     
    }
    
#ifdef NEWENCODE
    sf_transmission_pattern (scalar, scfsi, &frame);
    main_bit_allocation_new (smr, scfsi, bit_alloc, &adb, &frame, &glopts);
    //main_bit_allocation (smr, scfsi, bit_alloc, &adb, &frame, &glopts);

    if (error_protection)
      CRC_calc (&frame, bit_alloc, scfsi, &crc);

    write_header (&frame, &bs);
    //encode_info (&frame, &bs);
    if (error_protection)
      putbits (&bs, crc, 16);
    write_bit_alloc (bit_alloc, &frame, &bs);
    //encode_bit_alloc (bit_alloc, &frame, &bs);
    write_scalefactors(bit_alloc, scfsi, scalar, &frame, &bs);
    //encode_scale (bit_alloc, scfsi, scalar, &frame, &bs);
    subband_quantization_new (scalar, *sb_sample, j_scale, *j_sample, bit_alloc,
    			  *subband, &frame);
    //subband_quantization (scalar, *sb_sample, j_scale, *j_sample, bit_alloc,
    //	  *subband, &frame);
    write_samples_new(*subband, bit_alloc, &frame, &bs);
    //sample_encoding (*subband, bit_alloc, &frame, &bs);
#else
    transmission_pattern (scalar, scfsi, &frame);
    main_bit_allocation (smr, scfsi, bit_alloc, &adb, &frame, &glopts);  //比特分配
    if (error_protection)
      CRC_calc (&frame, bit_alloc, scfsi, &crc);  //如果有需要就添加CRC纠错
    encode_info (&frame, &bs);
    if (error_protection)
      encode_CRC (crc, &bs);
    encode_bit_alloc (bit_alloc, &frame, &bs);  //将比特分配打包到比特流中
    encode_scale (bit_alloc, scfsi, scalar, &frame, &bs);  //将比例因子打包到比特流中
    subband_quantization (scalar, *sb_sample, j_scale, *j_sample, bit_alloc,
			  *subband, &frame);  //量化子带
    sample_encoding (*subband, bit_alloc, &frame, &bs);  //将子带打包到比特流中
#endif

1、输出音频的采样率和目标码率

print_config() 函数中，含有音频的采样频率和目标码率：

fprintf (stderr, "--------------------------------------------\n");
  fprintf (stderr, "Input File : '%s'   %.1f kHz\n",
	   (strcmp (inPath, "-") ? inPath : "stdin"),	//输入文件
	   s_freq[header->version][header->sampling_frequency]); //采样频率
  fprintf (stderr, "Output File: '%s'\n",
	   (strcmp (outPath, "-") ? outPath : "stdout")); //输出文件
  fprintf (stderr, "%d kbps ", bitrate[header->version][header->bitrate_index]); //目标码率

使用START.mp2验证得：
在这里插入图片描述
采样率：44.1 kHZ
目标码率：192kbps

2、输出某个数据帧的

在common.h中定义输出文件

FILE* output1;

在main函数进入循环前打开文件

int j;
int k;
......
output1 = fopen("output.txt", "w+");

（1）比特数

在比特预算时，把该帧总分配比特数赋给了adb，输出adb所获得的值。

int main(int argc, char** argv)
{
	......
		adb = available_bits(&header, &glopts);//比特预算
		lg_frame = adb / 8;
		if (header.dab_extension) {
			/* in 24 kHz we always have 4 bytes */
			if (header.sampling_frequency == 1)
				header.dab_extension = 4;
			/* You must have one frame in memory if you are in DAB mode                 */
			/* in conformity of the norme ETS 300 401 http://www.etsi.org               */
				  /* see bitstream.c            */
			if (frameNum == 1)
				minimum = lg_frame + MINIMUM;
			adb -= header.dab_extension * 8 + header.dab_length * 8 + 16;
		}
		//add
		if (frameNum == 1)
		{
			//输出比特数
			fprintf(output1, "比特数:%d\n", adb);
		}
	......
}

（2）比例因子

比例因子存放在scalar[ ][ ][ ]中，每个声道有SBLIMIT个子带，每个子带有3个比例因子。

int main(int argc, char** argv)
{
		......
		scale_factor_calc(*sb_sample, scalar, nch, frame.sblimit);//比例因子
		pick_scale(scalar, &frame, max_sc);
		if (frame.actual_mode == MPG_MD_JOINT_STEREO) {
			/* this way we calculate more mono than we need */
			/* but it is cheap */
			combine_LR(*sb_sample, *j_sample, frame.sblimit);
			scale_factor_calc(j_sample, &j_scale, 1, frame.sblimit);//计算比例因子选择信息
		}
		//add
		if (frameNum == 1)
		{
			//输出比例因子
			fprintf(output1, "---------- 比例因子 ----------\n");
			for (k = 0; k < nch; k++)//声道
			{
				fprintf(output1, "声道%d：\n", k + 1);
				for (i = 0; i < SBLIMIT; i++)//每个子带有三个比例因子
				{
					fprintf(output1, "子带%d：\t", i);
					for (j = 0; j < 3; j++)
					{
						fprintf(output1, "%d\t", scalar[k][j][i]);
					}
					fprintf(output1, "\n");
				}
			}
		}
		......
}

（3）比特分配结果

比特分配存放在bit_alloc[ ][ ]中。每个声道有SBLIMIT个子带，每个子带有一个比特分配的结果。

int main(int argc, char** argv)
{
		......
		transmission_pattern(scalar, scfsi, &frame);
		main_bit_allocation(smr, scfsi, bit_alloc, &adb, &frame, &glopts);//比特分配
		if (frameNum == 1)
		{
			//输出比特分配
			fprintf(output1, "---------- 比特分配 ----------\n");
			for (k = 0; k < nch; k++)//声道
			{
				fprintf(output1, "声道%d：\n", k + 1);
				for (i = 0; i < SBLIMIT; i++)//每个子带有一个比特分配结果
				{
					fprintf(output1, "子带%d：\t", i);
					fprintf(output1, "%d\n", bit_alloc[k][i]);
				}
			}
		}
		......
}

3、不同特性的音频文件输出结果

（1）噪声

输入noise.wav（拍融合媒体制作与播出作业时录的环境音）

可用比特数:5008
---------- 比例因子 ----------
声道1：
子带0： 9 5 4
子带1： 10 12 12
子带2： 14 14 18
子带3： 14 15 18
子带4： 14 13 16
子带5： 19 14 20
子带6： 14 15 16
子带7： 15 16 16
子带8： 18 16 20
子带9： 19 14 19
子带10： 17 15 22
子带11： 17 15 18
子带12： 20 13 15
子带13： 16 14 15
子带14： 14 12 20
子带15： 15 16 14
子带16： 16 16 14
子带17： 20 14 14
子带18： 18 14 20
子带19： 17 14 16
子带20： 17 16 17
子带21： 17 14 16
子带22： 18 18 13
子带23： 17 17 19
子带24： 18 15 17
子带25： 16 16 13
子带26： 16 15 19
子带27： 19 16 21
子带28： 17 15 17
子带29： 16 16 15
子带30： 0 0 0
子带31： 0 0 0
声道2：
子带0： 9 5 5
子带1： 10 12 12
子带2： 14 14 15
子带3： 14 16 13
子带4： 15 16 15
子带5： 17 14 19
子带6： 15 15 16
子带7： 16 16 15
子带8： 18 16 16
子带9： 19 15 18
子带10： 18 14 20
子带11： 17 16 16
子带12： 22 13 16
子带13： 17 14 13
子带14： 17 13 18
子带15： 17 15 16
子带16： 21 13 14
子带17： 18 15 13
子带18： 18 14 19
子带19： 19 16 17
子带20： 18 16 15
子带21： 21 17 17
子带22： 18 15 14
子带23： 17 15 17
子带24： 20 16 16
子带25： 23 16 18
子带26： 19 15 16
子带27： 19 16 17
子带28： 18 14 21
子带29： 17 14 22
子带30： 0 0 0
子带31： 0 0 0
---------- 比特分配 ----------
声道1：
子带0： 5
子带1： 4
子带2： 3
子带3： 3
子带4： 4
子带5： 3
子带6： 3
子带7： 3
子带8： 3
子带9： 3
子带10： 2
子带11： 3
子带12： 3
子带13： 3
子带14： 3
子带15： 1
子带16： 2
子带17： 3
子带18： 2
子带19： 1
子带20： 1
子带21： 1
子带22： 2
子带23： 1
子带24： 0
子带25： 1
子带26： 1
子带27： 0
子带28： 1
子带29： 0
子带30： 0
子带31： 0
声道2：
子带0： 5
子带1： 3
子带2： 3
子带3： 4
子带4： 3
子带5： 4
子带6： 3
子带7： 3
子带8： 3
子带9： 3
子带10： 3
子带11： 3
子带12： 3
子带13： 3
子带14： 3
子带15： 1
子带16： 2
子带17： 3
子带18： 2
子带19： 1
子带20： 1
子带21： 1
子带22： 2
子带23： 1
子带24： 0
子带25： 1
子带26： 1
子带27： 0
子带28： 1
子带29： 0
子带30： 0
子带31： 0

（2）音乐

输入match.mp3

可用比特数:5008
---------- 比例因子 ----------
声道1：
子带0： 12 10 9
子带1： 9 10 7
子带2： 15 11 10
子带3： 11 11 10
子带4： 11 10 11
子带5： 12 10 9
子带6： 10 10 10
子带7： 9 10 10
子带8： 11 9 10
子带9： 12 9 12
子带10： 11 10 9
子带11： 12 11 10
子带12： 13 10 10
子带13： 12 9 9
子带14： 10 11 12
子带15： 11 10 11
子带16： 10 8 9
子带17： 15 9 12
子带18： 12 9 11
子带19： 11 11 9
子带20： 12 12 8
子带21： 8 9 8
子带22： 11 10 8
子带23： 12 11 10
子带24： 12 11 10
子带25： 13 10 10
子带26： 12 9 9
子带27： 12 11 11
子带28： 10 8 9
子带29： 10 9 11
子带30： 0 0 0
子带31： 0 0 0
声道2：
子带0： 10 8 7
子带1： 11 11 11
子带2： 10 10 10
子带3： 11 10 10
子带4： 13 11 10
子带5： 11 9 10
子带6： 14 13 8
子带7： 11 9 9
子带8： 13 11 11
子带9： 9 10 10
子带10： 9 10 11
子带11： 9 10 10
子带12： 10 10 10
子带13： 11 11 10
子带14： 10 9 10
子带15： 10 10 10
子带16： 10 11 9
子带17： 11 9 9
子带18： 17 11 9
子带19： 12 8 11
子带20： 10 10 8
子带21： 12 9 12
子带22： 11 8 9
子带23： 13 11 9
子带24： 13 12 9
子带25： 9 13 9
子带26： 11 9 9
子带27： 13 11 8
子带28： 16 9 9
子带29： 12 8 8
子带30： 0 0 0
子带31： 0 0 0
---------- 比特分配 ----------
声道1：
子带0： 4
子带1： 4
子带2： 3
子带3： 4
子带4： 4
子带5： 4
子带6： 4
子带7： 3
子带8： 3
子带9： 3
子带10： 3
子带11： 4
子带12： 4
子带13： 3
子带14： 4
子带15： 2
子带16： 2
子带17： 3
子带18： 3
子带19： 2
子带20： 2
子带21： 2
子带22： 2
子带23： 2
子带24： 1
子带25： 1
子带26： 1
子带27： 1
子带28： 1
子带29： 1
子带30： 0
子带31： 0
声道2：
子带0： 5
子带1： 3
子带2： 3
子带3： 5
子带4： 4
子带5： 4
子带6： 5
子带7： 4
子带8： 3
子带9： 3
子带10： 3
子带11： 4
子带12： 4
子带13： 3
子带14： 4
子带15： 2
子带16： 2
子带17： 3
子带18： 3
子带19： 2
子带20： 2
子带21： 2
子带22： 2
子带23： 2
子带24： 1
子带25： 1
子带26： 1
子带27： 1
子带28： 1
子带29： 1
子带30： 0
子带31： 0

（3）混合

输入START.wav

可用比特数:5008
---------- 比例因子 ----------
声道1：
子带0： 12 11 10
子带1： 10 11 11
子带2： 13 12 11
子带3： 14 12 10
子带4： 15 10 9
子带5： 13 11 11
子带6： 11 11 12
子带7： 13 12 12
子带8： 11 11 12
子带9： 11 11 12
子带10： 12 13 10
子带11： 13 10 11
子带12： 13 11 11
子带13： 12 12 9
子带14： 12 14 13
子带15： 11 11 11
子带16： 11 11 14
子带17： 12 12 12
子带18： 12 8 9
子带19： 12 12 9
子带20： 9 11 12
子带21： 13 7 8
子带22： 15 11 11
子带23： 12 11 11
子带24： 12 13 12
子带25： 13 11 13
子带26： 15 12 12
子带27： 14 13 12
子带28： 14 11 13
子带29： 11 12 13
子带30： 0 0 0
子带31： 0 0 0
---------- 比特分配 ----------
声道1：
子带0： 7
子带1： 8
子带2： 7
子带3： 8
子带4： 6
子带5： 6
子带6： 6
子带7： 5
子带8： 5
子带9： 5
子带10： 5
子带11： 3
子带12： 3
子带13： 3
子带14： 3
子带15： 3
子带16： 3
子带17： 3
子带18： 3
子带19： 3
子带20： 3
子带21： 3
子带22： 3
子带23： 3
子带24： 3
子带25： 3
子带26： 3
子带27： 3
子带28： 3
子带29： 3
子带30： 0
子带31： 0

参考

[1]沈静,阮若林.音频信号的感知编码技术研究[J].咸宁学院报,2007(03):75-77.
[2]数据压缩（十三）——MPEG音频编码原理及编码器调试

weixin_48462511

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
实验6 | MPEG音频编码

一、MPEG-1 Audio LayerII编码器原理1、多相滤波器组：将PCM样本变换到32个子带的频域信号如果输入的采样频率为48kHz，那么子带的频率宽度为48/（2*32）=0.75Hz缺点：（1）等带宽的滤波器组与人类听觉系统的临界频带不对应在低频区域，单个子带会覆盖多个临界频带。在这种情况下，量化比特数不能兼每个临界频带（2）滤波器组与其逆过程不是无失真的但滤波器组引入的误差差很小，且听不到（3）子带间频率有混叠滤波后的相邻子带有频率混叠现象，一个子带中的信号可以影响相邻子
复制链接

扫一扫