数据压缩原理实验_MPEG音频编码实验

数据压缩原理实验_MPEG音频编码实验

学号:201710413068
姓名:利满雯
班级:17广电工方向三

一、实验原理

1.程序设计的整体框架

MPEG-1 Audio Layer II编码器原理框图如下图所示:
在这里插入图片描述
为了解决时频分析的矛盾,MPEG-1 Audio LayerII编码器将PCM码流分成两条线进行处理:一条经多相滤波器组将PCM样本变换到32个子带的频域信号,每个子带有12个样点,对每个数据帧(32x12=384个样点)计算一次比例因子,用来确定量化器;另一条线对PCM信号进行FFT,由心理声学模型计算以频率为自变量的噪声掩蔽阈值,使量化噪声小于噪声掩蔽域值,同时通过信号掩蔽比SMR确定比例因子选择信息和动态比特分配,决定给子带分配多少量化比特数。最后通过装帧将量化后的子带的样本和边信息编码数据(比例因子选择信息、动态比特分配)以及辅助数据按照规定的帧格式组装成帧比特流输出。

2. 感知音频编码的设计思想

(1)两条线
第一条线:时域越短提取到的样本点数越多,越能反映瞬时变化情况
第二条线:把人耳的听觉特性转变成可计算的模型——心理声学模型,其输出类似听力曲线,以频率为横坐标,以能量为纵坐标。谱线间隔越小、频域的分解力越细越好。然而由以下实验可知,FFT展现不出信号瞬时变化的位置,只沿着第二条线进行的话,信号的重建会存在问题。

N1=256;
fs=100;
n1=(0:N1-1);
t1=n1/fs;
y=zeros(1,N1);
y(120)=400;
subplot(211);
plot(t1, y); 
title('signal in time domain');
xlabel('t(s)');
ylabel('Amplitude');
M1=256;
m1=(0:M1-1);
f1=m1*fs/M1;
y_freq1=abs(fft(y,M1));
subplot(212);
plot(f1, y_freq1); 
title('signal in frequency domain');
xlabel('Frequency(Hz)');
ylabel('Amplitude');

y(120)=400
在这里插入图片描述

y(240)=400
在这里插入图片描述
(2)时频分析的矛盾
频域的频谱分辨率和时域的变化率之间存在矛盾,时域信号取得越短,频域谱线间隔越大。

3.心理声学模型的实现过程

(1)临界频带的概念
临界频带是指当某个纯音被以它为中心频率,且具有一定带宽的连续噪声所掩蔽时,如果该纯音刚好被听到时的功率等于这一频带内的噪声功率,这个带宽为临界频带的宽度。
(2)掩蔽值计算的思路
①将样本变换到频域:32个等分的子带信号并不能精确地反映人耳的听觉特性,引入FFT补偿频率分辨率不足的问题。
②确定声压级别:
在这里插入图片描述
③考虑安静时阈值
④将音频信号分解成“乐音”和“非乐音/噪声”部分:因为两种信号的掩蔽能力不同。
⑤音调和非音调掩蔽成分的消除:利用标准中给出的绝对阈值消除被掩蔽成分; 考虑在每个临界频带内,小于0.5Bark的距离中只保留最高功率的成分 。
⑥单个掩蔽阈值的计算:音调成分和非音调成分单个掩蔽阈值根据标准中给出的算法求出。
⑦全局掩蔽阈值的计算:
在这里插入图片描述
⑧每个子带的掩蔽阈值:选择出本子带中最小的阈值作为子带阈值。
⑨计算每个子带信号掩蔽比SMR并将SMR传递给编码单元。
SMR = 信号能量 / 掩蔽阈值

4.码率分配的实现思路

(1)在调整到固定的码率之前,先确定可用于样值编码的有效比特数,这个数值取决于比例因子、比例因子选择信息、比特分配信息以及辅助数据所需比特数;
(2)比特分配的过程:对每个子带计算掩蔽-噪声比MNR,是信噪比SNR – 信掩比SMR,即:MNR = SNR – SMR。使整帧和每个子带的总噪声-掩蔽比最小。这是一个循环过程,每一次循环对最低MNR的子带分配比特,使获益最大的子带的量化级别增加一级。

二、实验流程

  1. Filter sliding window of data to get 32 subband samples per channel.
    (window_subband,filter_subband)
  2. If joint stereo mode, combine left and right channels for subbands above #jsbound#.
    (combine_LR)
  3. Calculate scalefactors for the frame, and also calculate scalefactor select information.
    (*_scale_factor_calc)
  4. Calculate psychoacoustic masking levels using selected psychoacoustic model.
    (psycho_i, psycho_ii)
  5. Perform iterative bit allocation for subbands with low mask_to_noise ratios using masking levels from step 4.
    (*_main_bit_allocation)
  6. If error protection flag is active, add redundancy for error protection.
    (*_CRC_calc)
  7. Pack bit allocation, scalefactors, and scalefactor select headerrmation onto bitstream.
    (_encode_bit_alloc,_encode_scale,transmission_pattern)
  8. Quantize subbands and pack them into bitstream.
    (*_subband_quantization, *_sample_encoding)

三、关键代码及分析

输出音频的采样率和目标码率;选择某个数据帧,输出该帧所分配的比特和比例因子
#ifdef NEWENCODE
    // 计算比例因子
    scalefactor_calc_new(*sb_sample, scalar, nch, frame.sblimit);
    find_sf_max (scalar, &frame, max_sc);
    if (frame.actual_mode == MPG_MD_JOINT_STEREO) {
      /* this way we calculate more mono than we need */
      /* but it is cheap */
      combine_LR_new (*sb_sample, *j_sample, frame.sblimit);
      scalefactor_calc_new (j_sample, &j_scale, 1, frame.sblimit);
    }
#else
    scale_factor_calc (*sb_sample, scalar, nch, frame.sblimit);
    pick_scale (scalar, &frame, max_sc);
	

    if (frame.actual_mode == MPG_MD_JOINT_STEREO) {
      /* this way we calculate more mono than we need */
      /* but it is cheap */
      combine_LR (*sb_sample, *j_sample, frame.sblimit);
      scale_factor_calc (j_sample, &j_scale, 1, frame.sblimit);
    }
#endif
	/* 添加 */
	FILE *output = fopen("output.txt", "wb");
	if (frameNum == 20)
	{
		fprintf(output,"输出音频的采样率为:%.1fkhz \r\n", s_freq[header.version][header.sampling_frequency]);
		fprintf(output, "目标码率为:%dMbps \r\n", bitrate[header.version][header.bitrate_index]);
		fprintf(output, "选择的数据帧为:%d \r\n", frameNum);
		fprintf(output, "该帧所分配的比特数为:%dbits\r\n", adb);
		for (int k = 0; k < nch; k++)//nch即num channels: 1 for mono, 2 for stereo
		{
			fprintf(output, "声道[%d] \r\n", k + 1);
			for (int j = 0; j < frame.sblimit; j++)//子带总数
			{
				fprintf(output, "子带[%d]:    ", j + 1);
				for (int m = 0; m < 3; m++)//每个子带有3个比例因子
				{
					fprintf(output, "%d\t", scalar[k][m][j]);
				}
				fprintf(output, "\r\n");
			}
		}
	}
输出该数据帧的比特分配结果
#ifdef NEWENCODE
    sf_transmission_pattern (scalar, scfsi, &frame);
    main_bit_allocation_new (smr, scfsi, bit_alloc, &adb, &frame, &glopts);
    //main_bit_allocation (smr, scfsi, bit_alloc, &adb, &frame, &glopts);

    if (error_protection)
      CRC_calc (&frame, bit_alloc, scfsi, &crc);

    write_header (&frame, &bs);
    //encode_info (&frame, &bs);
    if (error_protection)
      putbits (&bs, crc, 16);
    write_bit_alloc (bit_alloc, &frame, &bs);
    //encode_bit_alloc (bit_alloc, &frame, &bs);
    write_scalefactors(bit_alloc, scfsi, scalar, &frame, &bs);
    //encode_scale (bit_alloc, scfsi, scalar, &frame, &bs);
    subband_quantization_new (scalar, *sb_sample, j_scale, *j_sample, bit_alloc,
    			  *subband, &frame);
    //subband_quantization (scalar, *sb_sample, j_scale, *j_sample, bit_alloc,
    //	  *subband, &frame);
    write_samples_new(*subband, bit_alloc, &frame, &bs);
    //sample_encoding (*subband, bit_alloc, &frame, &bs);
#else
transmission_pattern (scalar, scfsi, &frame);
//根据掩蔽值为子带进行迭代比特分配让掩噪比最低之后输出每个子带的比特分配信息
    main_bit_allocation (smr, scfsi, bit_alloc, &adb, &frame, &glopts);
	/* 添加 */
	if (frameNum == 20)
	{
		fprintf(output, "\n比特分配:\n");		
		for (int k = 0; k < nch; k++)
		{
			fprintf(output, "channel[%d] \r\n", k + 1);
			for (int j = 0; j < frame.sblimit; j++)
			{
				fprintf(output, "subband[%d]:%d\r\n", j, bit_alloc[k][j]);
			}
		}
	}

三、实验结果及分析

  1. 在本次试验中我使用test.wav和match.mp3进行测试,实验结果如下所示:
    (1)test.wav:单声道
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    (2)match.mp3:双声道
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  2. test.mp2有30个子带,match.mp2有31个子带,每个子带有3个比例因子,每个数据帧传送3个比例因子,再由比例因子选择信息选择出其中的1个。
  3. 由每个子带的比特分配可得,频率越高(子带序号越大),分配到的比特数越少。这是由于在低频子带中,为了保护音调和共振峰的结构,要求使用较小的量化阶数、较多的量化级数,即分配较多的位数来表示样本值。而话音中的摩擦音和类似噪声的声音,通常出现在高频子带中,对它分配较少的比特数。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值