一.音频信号的数字化
电视广播离不开声音信号,随着人们对电视质量的要求越来越高,在数字电视广播、高清晰数字电视和数字电影中不仅应有高质量的图像,还要保证有高质量的伴音。
我们行业标准GY/T 156-2000《演播室数字音频参数》中对音频信号的取样频率、量化比特数和声道数等作出了规定。
1.取样频率:演播室数字音频参数标准规定,音频信号的取样频率优选为48kHz,也可以选用32kHz或44.1kHz。
2.量化比特数:演播室数字音频编码方式优选PCM20bit线性量化,也可以选用16bit、18bit以及24bit的线性量化。
3.编码方式:为了减小误码对信号幅度的影响,在数字音频编码中通常不采用自然二进制码或偏置二进制码,而是采用2的补码,这样可以防止产生不希望的噪音。
另外标准中还对4轨声音记录格式和8轨声音记录格式作出了规定。
二. 数字音频信号的压缩过程
音频信号数字化之后所面临的问题是巨大的数据量如何进行有效地传输和存储的问题,在数字演播室中,无压缩的有效码率高达1.92Mb/s,而在CD和广播该项数值分别为1.41 Mb/s和1 Mb/s,因此为了提高传输效率,降低存储费用,就必须对数字音频信号进行压缩编码。
1.数字音频信号的压缩机理
1.去除声音信号中的冗余部分
声音信号中的冗余部分包括时域信息冗余和频域信息冗余。
a.其中时域信息冗余主要表现在:1.幅度非均匀分布,即不同幅度的样值出现的概率不同,小幅度的样值比大幅 度的样值出现的概率高;2.样本之间的相关性;3.基音之间的相关性。
b.频率信息冗余主要表现在:1.非均匀功率谱密度,低频成分能量较高,高频成分能量较低;2.语音特有的短时 功率谱密度,在某些频率出现峰值,而某些频率出现谷值。
2.利用人耳的听觉特性
a.人耳对各频率的灵敏度是不同的,即在不同的频率,人耳会表现出不同的敏感度。因此可以将输入信号与最小 听觉阈值相比较,去除那些低于阈值的信号,这样就可以压缩数据。
b.频率之间的掩蔽效应,这是指人耳接受信号时,不同频率之间的相互干扰。例如当高电平的频率点信号和低电 平的不同频率点信号同时出现时,电平较低的频率点的声音将听不到。这样可以将低于掩蔽阈值的信号不编 码,高于掩蔽阈值的信号将重新分配量化比特值。
c.时域掩蔽效应,这是指在一个强信号之前或之后的弱信号也会被屏蔽掉。
利用人耳的感觉特性对数据流进行压缩,是既能得到较高的压缩比又能保证音质的重要原因。
2.音频压缩编码质量评价指标
通常用以下属性来衡量数字音频信号的编码质量:
1.比特率;2.主观/客观的语音质量;3.计算复杂度;4.延迟量;5.对于通道误码的灵敏度
3.常见的数字音频压缩标准
随着数字电视技术和多媒体通信技术的广泛应用,数字音频压缩编码技术在近20年也得到了快速的发展。典型的编码标准有:MPEG-1、MPEG-2 Audio、MPEG-2 AAC、MPEG-4 Audio和Dolby AC-3音频编码标准等。