zhzh_cuc-CSDN博客

原创 H.264编码实验

一、实验要求选择一个.mp4或者.264文件。在码流分析仪软件中打开该文件，从几个层次进行分析：（1）分析SPS和PPS里都包含哪些主要的信息，给出参数值。（例如分辨率、帧率、GOP结构等等）（2）以一个GOP为例，分析如下信息：每个图像帧的类型及所用的编码比特数、QP值；并以图像帧号为横坐标、每帧所用比特数为纵坐标画出曲线图；以图像帧号为横坐标、每帧所用QP为纵坐标画出曲线图。以第一个I帧作为分析对象，基于该帧图像的空间特性，分析每个宏块所采用的编码类型及其比例。以第一个P帧作为分析对象，

2021-07-11 18:03:43 320

原创 MPEG音频编码实验

一、实验原理MPEG-1 Audio LayerII 编码器原理心理声学模型：根据人耳的听觉阈值和听觉掩蔽特性建立的模型，可以通过这个模型消除更多的冗余数据，计算信号中不可听觉感知的部分多相滤波器组(Polyphase Filter Bank)：将PCM样本变换到32个子带的频域信号，如果输入的采样频率为48kHz，那么子带的频率宽度为48/（2*32）=0.75Hz滤波器组：分出32个频带，每个频带有12个点比特分配器(Bit Allocator)：根据心理声学模型的计算结果，为

2021-06-15 14:53:38 305 1

原创随机信号的参数建模法

一、基本介绍为随机信号建立参数模型是研究随机信号的一种基本方法，其含义是认为随机信号 x(n) 是由白噪 w(n) 激励某一确定系统的响应。只要白噪的参数确定了，研究随机信号就可以转化成研究产生随机信号的系统。对平稳随机信号，三种常用的线性模型分别是 AR 模型（自回归模型 Auto-regression model），MA 模型（滑动平均模型 Moving average model）和 ARMA 模型（自回归滑移平均模型 Auto-regression-Moving average model）。

2021-06-06 18:44:13 235

原创 JPEG原理分析及JPEG解码器的调试

一、实验目的掌握JPEG编解码系统的基本原理。初步掌握复杂的数据压缩算法实现，并能根据理论分析需要实现所对应数据的输出。二、实验内容1、JPEG编解码原理JPEG是最常用的图像文件格式。其主要是采用预测编码（DPCM）、离散余弦变换（DCT）以及熵编码的联合编码方式，以去除冗余的图像和彩色数据，属于有损压缩格式，它能够将图像压缩在很小的储存空间，一定程度上会造成图像数据的损伤。尤其是使用过高的压缩比例，将使最终解压缩后恢复的图像质量降低，如果追求高品质图像，则不宜采用过高的压缩比例。零偏置

2021-06-06 17:10:02 567

原创 DPCM 压缩系统的实现和分析

一、实验目的掌握DPCM编解码系统的基本原理。初步掌握实验用C/C++/Python等语言编程实现DPCM编码器，并分析其压缩效率。二、实验原理1.DPCM编解码原理将新输入的像素值和前一个像素值的预测值作差，并对差值进行编码编码后的差值一路直接输出另一路通过解码器解出差值（反量化），并与前一个像素的预测值相加，得到当前像素的预测值反量化的图像：2.DPCM编码系统的设计在一个DPCM系统中需要设计两部分：预测器、量化器预测器采用左侧、上方预测均可量化器采用8比特均匀量化

2021-04-25 11:04:58 142

原创 LZW编解码算法的实现

一、实验目的掌握词典编码的基本原理，用C/C++等语言编程实现LZW解码器并分析编解码算法二、实验内容1．LZW编码原理和实现算法LZW的编码思想是不断地从字符流中提取新的字符串，通俗地理解为新“词条”，然后用“代号”也就是码字表示这个“词条”。这样一来，对字符流的编码就变成了用码字去替换字符流，生成码字流，从而达到压缩数据的目的。LZW编码是围绕称为词典的转换表来完成的。LZW编码器通过管理这个词典完成输入与输出之间的转换。LZW编码器的输入是字符流，字符流可以是用8位ASCII字符组成的字符

2021-04-22 16:04:19 516

原创 bmp文件与yuv文件的转换

一、实验目的1.上网查找若干 BMP 文件，并加入自己的水印2.编写代码实现将第一步所生成的多个BMP文件转化为YUV文件，在命令行中设置每个画面出现的帧数，且最后的YUV文件应至少包含200帧。3.生成的 YUV 文件用 YUVviewer 进行播放观看。二、实验内容1.文件属性bmp 文件大小为256 * 256bmp 文件深度为32位yuv 的格式为4：2：0每个 bmp 出现 40 帧2.bmp格式理论典型的 BMP 图像文件由四部分组成：（1）位图头文件数据结构，它包

2021-04-06 22:49:42 475

原创 PNG图像文件格式解析

一、实验要求使用 FlexHEX 对 png 图片文件进行格式解析并分析使用图片：二、背景介绍PNG是20世纪90年代中期开始开发的图像文件存储格式，是一种采用无损压缩算法的位图格式，其目的是企图替代GIF和TIFF文件格式，同时增加一些GIF文件格式所不具备的特性。PNG用来存储灰度图像时，灰度图像的深度可多到16位，存储彩色图像时，彩色图像的深度可多到48位，并且还可存储多到16位的α通道数据。PNG使用从LZ77派生的无损数据压缩算法。PNG图像格式文件(或者称为数据流)由一个8字节的

2021-03-24 21:39:52 1767

原创彩色空间内YUV和RGB的相互转换

一、实验目的进一步理解彩色空间的概念并掌握不同彩色空间转换的基本方程。通过逐步设计程序，掌握编程细节：如查找表的设计，内存分配，对 U 和 V 信号进行下采样，文件读写过程等。掌握程序调试的基本方法。编写RGB转化为YUV程序，重点掌握函数定义，部分查找表的初始化和调用，缓冲区分配。将得到的RGB文件转换为YUV文件，用YUV Viewer播放器观看，验证是否正确。编写将YUV转换为RGB的程序。将给定的实验数据用该程序转换为RGB文件。并与原RGB文件进行比较，如果有误差，分析误差来自何处。

2021-03-23 17:17:53 395

原创分别对RGB、YUV文件分析三个通道的概率分布，并计算各自的熵

一、作业要求对down.rgb和down.yuv分析三个通道的概率分布，并计算各自的熵。（编程实现）两个文件的分辨率均为256 * 256yuv文件为4:2:0采样空间。YUV格式按照全部像素的Y数据块、U数据块和V数据块依次存放。存储格式为：rgb文件按每个像素BGR分量依次存放；本文采用 C++ 编写二、思路分析1.RGBrgb 文件中每个像素都按照 BGR 依次存放，则为BGRBGRBGRBGR…循环，由图像分辨率256 * 256可得，此 rgb 文件共有 256 * 256 *

2021-03-08 12:04:15 292 1

原创 Audacity分析清音浊音爆破音的时域及频域特性

Audacity分析清音浊音爆破音的时域及频域特性自己分别录制了清音浊音爆破音的三段 mp3 格式音频，导入 Audacity 中，即可观察到音频的时域波形，点击分析->频域分析，即可观察到频谱。一、清音由下图可见，为一段清音音频的时域波形放大后可看到为一段接近于白噪声的波形，声音幅度低频域分析后可以看到低频部分能量较大，高频部分能量最大，中频部分较为平坦二、浊音由下图可见，为一段浊音音频的时域波形放大后可以看到其呈现周期性频域分析后可以看到整体能量较大，高频部分能量低，主要

2021-03-06 14:24:09 409

weixin_45715387的博客