数据压缩
文章平均质量分 81
zhzh_cuc
这个作者很懒,什么都没留下…
展开
-
H.264编码实验
一、实验要求 选择一个.mp4或者.264文件。 在码流分析仪软件中打开该文件,从几个层次进行分析: (1)分析SPS和PPS里都包含哪些主要的信息,给出参数值。(例如分辨率、帧率、GOP结构等等) (2)以一个GOP为例,分析如下信息: 每个图像帧的类型及所用的编码比特数、QP值;并以图像帧号为横坐标、每帧所用比特数为纵坐标画出曲线图;以图像帧号为横坐标、每帧所用QP为纵坐标画出曲线图。 以第一个I帧作为分析对象,基于该帧图像的空间特性,分析每个宏块所采用的编码类型及其比例。 以第一个P帧作为分析对象,原创 2021-07-11 18:03:43 · 293 阅读 · 0 评论 -
MPEG音频编码实验
一、实验原理 MPEG-1 Audio LayerII 编码器原理 心理声学模型:根据人耳的听觉阈值和听觉掩蔽特性建立的模型,可以通过这个模型消除更多的冗余数据,计算信号中不可听觉感知的部分 多相滤波器组(Polyphase Filter Bank):将 PCM样本变换到32个子带的频域信号,如果输入的采样频率为48kHz,那么子带的频率宽度为48/(2*32)=0.75Hz 滤波器组:分出32个频带,每个频带有12个点 比特分配器(Bit Allocator):根据心理声学模型的计算结果,为原创 2021-06-15 14:53:38 · 264 阅读 · 1 评论 -
随机信号的参数建模法
一、基本介绍 为随机信号建立参数模型是研究随机信号的一种基本方法,其含义是认为随机信号 x(n) 是由白噪 w(n) 激励某一确定系统的响应。只要白噪的参数确定了,研究随机信号就可以转化成研究产生随机信号的系统。 对平稳随机信号,三种常用的线性模型分别是 AR 模型(自回归模型 Auto-regression model),MA 模型(滑动平均模型 Moving average model)和 ARMA 模型(自回归滑移平均模型 Auto-regression-Moving average model)。原创 2021-06-06 18:44:13 · 227 阅读 · 0 评论 -
JPEG原理分析及JPEG解码器的调试
一、实验目的 掌握JPEG编解码系统的基本原理。初步掌握复杂的数据压缩算法实现,并能根据理论分析需要实现所对应数据的输出。 二、实验内容 1、JPEG编解码原理 JPEG是最常用的图像文件格式。其主要是采用预测编码(DPCM)、离散余弦变换(DCT)以及熵编码的联合编码方式,以去除冗余的图像和彩色数据,属于有损压缩格式,它能够将图像压缩在很小的储存空间,一定程度上会造成图像数据的损伤。尤其是使用过高的压缩比例,将使最终解压缩后恢复的图像质量降低,如果追求高品质图像,则不宜采用过高的压缩比例。 零偏置原创 2021-06-06 17:10:02 · 535 阅读 · 0 评论 -
DPCM 压缩系统的实现和分析
一、实验目的 掌握DPCM编解码系统的基本原理。初步掌握实验用C/C++/Python等语言编程实现DPCM编码器,并分析其压缩效率。 二、实验原理 1.DPCM编解码原理 将新输入的像素值和前一个像素值的预测值作差,并对差值进行编码 编码后的差值一路直接输出 另一路通过解码器解出差值(反量化),并与前一个像素的预测值相加,得到当前像素的预测值 反量化的图像: 2.DPCM编码系统的设计 在一个DPCM系统中需要设计两部分:预测器、量化器 预测器采用左侧、上方预测均可 量化器采用8比特均匀量化原创 2021-04-25 11:04:58 · 135 阅读 · 0 评论 -
LZW编解码算法的实现
一、实验目的 掌握词典编码的基本原理,用C/C++等语言编程实现LZW解码器并分析编解码算法 二、实验内容 1.LZW编码原理和实现算法 LZW的编码思想是不断地从字符流中提取新的字符串,通俗地理解为新“词条”,然后用“代号”也就是码字表示这个“词条”。这样一来,对字符流的编码就变成了用码字去替换字符流,生成码字流,从而达到压缩数据的目的。 LZW编码是围绕称为词典的转换表来完成的。LZW编码器通过管理这个词典完成输入与输出之间的转换。LZW编码器的输 入是字符流,字符流可以是用8位ASCII字符组成的字符原创 2021-04-22 16:04:19 · 509 阅读 · 0 评论 -
bmp文件与yuv文件的转换
一、实验目的 1.上网查找若干 BMP 文件,并加入自己的水印 2.编写代码实现将第一步所生成的多个BMP文件转化为YUV文件,在命令行中设置每个画面出现的帧数,且最后的YUV文件应至少包含200帧。 3.生成的 YUV 文件用 YUVviewer 进行播放观看。 二、实验内容 1.文件属性 bmp 文件大小为256 * 256 bmp 文件深度为32位 yuv 的格式为4:2:0 每个 bmp 出现 40 帧 2.bmp格式理论 典型的 BMP 图像文件由四部分组成: (1)位图头文件数据结构,它包原创 2021-04-06 22:49:42 · 448 阅读 · 0 评论 -
PNG图像文件格式解析
一、实验要求 使用 FlexHEX 对 png 图片文件进行格式解析并分析 使用图片: 二、背景介绍 PNG是20世纪90年代中期开始开发的图像文件存储格式,是一种采用无损压缩算法的位图格式,其目的是企图替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性。PNG用来存储灰度图像时,灰度图像的深度可多到16位,存储彩色图像时,彩色图像的深度可多到48位,并且还可存储多到16位的α通道数据。PNG使用从LZ77派生的无损数据压缩算法。 PNG图像格式文件(或者称为数据流)由一个8字节的原创 2021-03-24 21:39:52 · 1746 阅读 · 0 评论 -
彩色空间内YUV和RGB的相互转换
一、实验目的 进一步理解彩色空间的概念并掌握不同彩色空间转换的基本方程。 通过逐步设计程序,掌握编程细节:如查找表的设计,内存分配,对 U 和 V 信号进行下采样,文件读写过程等。掌握程序调试的基本方法。 编写RGB转化为YUV程序,重点掌握函数定义,部分查找表的初始化和调用,缓冲区分配。将得到的RGB文件转换为YUV文件,用YUV Viewer播放器观看,验证是否正确。 编写将YUV转换为RGB的程序。将给定的实验数据用该程序转换为RGB文件。并与原RGB文件进行比较,如果有误差,分析误差来自何处。原创 2021-03-23 17:17:53 · 370 阅读 · 0 评论 -
分别对RGB、YUV文件分析三个通道的概率分布,并计算各自的熵
一、作业要求 对down.rgb和down.yuv分析三个通道的概率分布,并计算各自的熵。(编程实现) 两个文件的分辨率均为256 * 256 yuv文件为4:2:0采样空间。YUV格式按照全部像素的Y数据块、U数据块和V数据块依次存放。 存储格式为:rgb文件按每个像素BGR分量依次存放; 本文采用 C++ 编写 二、思路分析 1.RGB rgb 文件中每个像素都按照 BGR 依次存放,则为BGRBGRBGRBGR…循环,由图像分辨率256 * 256可得,此 rgb 文件共有 256 * 256 *原创 2021-03-08 12:04:15 · 242 阅读 · 1 评论 -
Audacity分析清音浊音爆破音的时域及频域特性
Audacity分析清音浊音爆破音的时域及频域特性 自己分别录制了清音浊音爆破音的三段 mp3 格式音频,导入 Audacity 中,即可观察到音频的时域波形,点击分析->频域分析,即可观察到频谱。 一、清音 由下图可见,为一段清音音频的时域波形 放大后可看到为一段接近于白噪声的波形,声音幅度低 频域分析后可以看到低频部分能量较大,高频部分能量最大,中频部分较为平坦 二、浊音 由下图可见,为一段浊音音频的时域波形 放大后可以看到其呈现周期性 频域分析后可以看到整体能量较大,高频部分能量低,主要原创 2021-03-06 14:24:09 · 390 阅读 · 0 评论