DPCMB编解码原理
DPCM是差分预测编码调制的缩写,是比较典型的预测编码系统。在DPCM系统中,需要注意的是预测器的输入是已经解码以后的样本。之所以不用原始样本来做预测,是因为在解码端无法得到原始样本,只能得到存在误差的样本。因此,在DPCM编码器中实际内嵌了一个解码器,如编码器中虚线框中所示。
在一个DPCM系统中,有两个因素需要设计:预测器和量化器。理想情况下,预测器和量化器应进行联合优化。实际中,采用一种次优的设计方法:分别进行线性预测器和量化器的优化设计。![在这里插入图片描述]
Xk是输入信号,X’k是重建信号,作为预测器与下一个输入信号做差值得到预测信号En,预测信号再经过量化输出。量化后的预测信号再经过反量化后得到的值与上一个重建信号之和得到新的重建信号。
DPCM系统实际上就是对这个差值信号进行量化编码,用来补偿过去编码中产生的量化误差,它是一个反馈系统,采用这种结构可以避免量化误差的积累。
PSNR
psnr一般是用于最大值信号和背景噪音之间的一个工程项目。通常在经过影像压缩之后,输出的影像都会在某种程度与原始影像不同。为了衡量经过处理后的影像品质,我们通常会参考PSNR值来衡量某个处理程序能否令人满意。它是原图像与被处理图像之间的均方误差相对于(2n-1)2的对数值(信号最大值的平方,n是每个采样值的比特数),它的单位是dB。公式如下:
PSNR=10*log10((2n-1)2/MSE)
其中,MSE是原图像(语音)与处理图像(语音)之间均方误差。
Peak就是指8bits表示法的最大值255。MSE指MeanSquareError,I(角标n)指原始影像第n个pixel值,P(角标n)指经处理后的影像第n个pixel值。PSNR的单位为dB。所以PSNR值越大,就代表失真越少。
实验目的
1,掌握DPCM编解码系统的基本原理。
2,初步掌握实验用C/C++/Python等语言编程实现DPCM编码器,并分析其压缩效率。
实验要求
1、在DPCM编码器实现的过程中可同时输出预测误差图像和重建图像。
2、将预测误差图像写入文件并将该文件输入Huffman编码器,得到输出码流、给出概率分布图并计算压缩比。
3、将原始图像文件输入Huffman编码器,得到输出码流、给出概率分布图并计算压缩比。最后比较两种系统(1.DPCM+ 熵编码和2. 仅进行熵编码)之间的编码效率(压缩比和图像质量)。压缩质量以PSNR进行计算。
实验过程
1、编写DPCM编解码代码
代码如下(示例):(采用8bit量化)
for(int i=0;i < frameWidth*frameHeight;i++)
{
if(i % frameWidth==0)
{
prebuf[i]=(yBuf[i]-128)/2+128;
resconbuf[i]=(prebuf[i]-128)*2+ 128;//重现信号为预测信号反量化后的值+0
}
else{
prebuf[i]=(yBuf[i]- resconbuf[i-1])/2+128;// 预测信号为当前输入的y信号与上一个重现信号的差值做量化
resconbuf[i]=((prebuf[i]-128)*2+resconbuf[i-1]);//重现信号为当前预测信号反量化后的值与上个重现信号的和的值
}}
2、运行程序,原图像为Lena256B.yuv,得到重现图像re.yuv ,预测图像pre.yuv
3、编写概率分布代码,把概率分布以txt形式输出,再用MATLAB 绘制其概率密度曲线
原图Lena256B.yuv的亮度灰度值概率分布曲线
预测图像pre.yuv的亮度灰度值概率分布曲线
4、将原始图像与预测误差图像分别输入Huffman编码器,得到huff文件与txt文件
txt文件说明了编码规则,第一列为灰度值,第二列的数值为编码码长,第三列数值为码字。比如对于pre.yuv文件,灰度值为127出现的次数最高,它就被编码成0,码长为1.
5、计算压缩比
原始文件 | 压缩后文件 | 原始大小 | 压缩后大小 | 压缩比 |
---|---|---|---|---|
Lena256B.yuv | Lena.huff | 96KB | 69KB | 28.725% |
pre.yuv | Lenapre.huff | 96KB | 45KB | 53.125% |
6、编写PSNR代码
double MSE = 0;
double sub = 0;
double sum = 0;
for (int j = 0; j < 256; j++)
{
for (int i = 0; i <256; i++)
{
sub = yBuf[i] - resconbuf[i];
sum = sum + pow(sub, 2);
}
}
MSE = (sum) / (256 * 256);
double psnr = 10 * log10 ((255 * 255) / MSE);
cout<<"PSNR="<<psnr<<endl;
运行程序,得到psnr结果:
PSNR=51.1411
结果分析:
1、从预测误差图像概率分布与原始图像的概率分布对比可以看出,预测误差图像的概率分布更集中,大部分像素都集中在灰度值为100-150之间,像素之间的关联性更高分布的很集中,很适合用霍夫曼编码进行熵编码,压缩的时候更加容易,而原始图像的概率分布则更均匀,在进行霍夫曼编码时压缩的效率就没有那么高。
2、PSNR越大,图像质量越好,8bit量化的重现图像的PSNR=51.1411dB,说明其预测图像质量还不错。