Mr_Starlna-CSDN博客

原创 H.264编码实验

一、实验解码将.264文件转化为yuv文件，方便后续实验。修改其decode的输入输出文件，使其得到yuv文件。运行结果二、实验编码更改其相应的数值，输出需要的.264文件主要电脑不行这里就生成一个10帧输出结果因为后续实验之前的264出来一些问题，我更换了使用的264文件，因步骤与之前相同，故只更改最后的实验数据部分。三、实验结论关于码流分析部分已经在上一篇博客中说明，此处只对PSNR 部分进行解析。由图可知，当输出格式一定时，码率越大则psnr越高，说明码

2021-07-14 21:56:27 210

原创 MP4码流分析

一、概念综述1.SPSSPS即Sequence Paramater Set，又称作序列参数集。SPS中保存了一组编码视频序列(Coded video sequence)的全局参数。所谓的编码视频序列即原始视频的一帧一帧的像素数据经过编码之后的结构组成的序列。而每一帧的编码后数据所依赖的参数保存于图像参数集中。一般情况SPS和PPS的NAL Unit通常位于整个码流的起始位置。但在某些特殊情况下，在码流中间也可能出现这两种结构，主要原因可能为：解码器需要在码流中间开始解码；编码器在编码的过程中改变了

2021-06-17 22:02:25 1120

原创 MPEG音频编码实验

一、MPEG-1格式MPEG标准主要有以下五个，MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21等。MPEG-1标准于1992年正式出版，标准的编号为ISO/IEC11172，其标题为“码率约为1.5Mb/s用于数字存贮媒体活动图像及其伴音的编码”。MPEG-1主要解决多媒体的存储问题，它的成功制定，使得以VCD和MP3为代表的MPEG-1产品迅速在世界范围内普及。二、理解程序设计的整体框架1.短时平稳性对于音频的设计需要用到人耳的声学特性，其中利用到人耳的短时平稳性。2.

2021-06-16 22:11:24 309

原创 JPEG原理分析及JPEG解码器的调试

一.关于JPEG1.JPEG简介JPEG（ Joint Photographic Experts Group）即联合图像专家组，是用于连续色调静态图像压缩的一种标准，文件后缀名为.jpg或.jpeg，是最常用的图像文件格式。其主要是采用预测编码（DPCM）、离散余弦变换（DCT）以及熵编码的联合编码方式，以去除冗余的图像和彩色数据，属于有损压缩格式，它能够将图像压缩在很小的储存空间，一定程度上会造成图像数据的损伤。尤其是使用过高的压缩比例，将使最终解压缩后恢复的图像质量降低，如果追求高品质图像，则不宜采

2021-06-10 14:13:11 346

原创实验四 DPCM 压缩系统的实现和分析

一.实验目的掌握DPCM编解码系统的基本原理。初步掌握实验用C/C++/Python等语言编程实现DPCM编码器，并分析其压缩效率。二.实验原理DPCM是差分预测编码调制的缩写，是比较典型的预测编码系统。在DPCM系统中，需要注意的是预测器的输入是已经解码以后的样本。之所以不用原始样本来做预测，是因为在解码端无法得到原始样本，只能得到存在误差的样本。因此，DPCM编码器中实际内嵌了一个解码器，如编码器中虚线框中所示。可以由一个具体例子来进行解释说明。三.实验所需结果在DPCM编码器实现的过

2021-05-09 22:07:48 186

原创 LZW 编解码算法实现与分析

一、实验目的掌握词典编码的基本原理，用C/C++/Python等语言编程实现LZW解码器并分析编解码算法。二、主要设备安装 Windows 和 Visual Studio 等编程平台的个人计算机。三、实验内容1．LZW编码原理和实现算法LZW的编码思想是不断地从字符流中提取新的字符串，通俗地理解为新“词条”，然后用“代号”也就是码字表示这个“词条”。这样一来，对字符流的编码就变成了用码字去替换字符流，生成码字流，从而达到压缩数据的目的。LZW编码是围绕称为词典的转换表来完成的。LZW编码器通过

2021-04-21 01:17:38 230

原创 bmp文件变换到yuv文件

一、实验目的1.了解bmp文件的构造形式2.将bmp文件转换为yuv文件并播放二、bmp文件构造1.存储格式bmp文件按如下顺序排列位图文件头BITMAPFILEHEADER位图信息头BITMAPINFOHEADER调色板Palette实际的位图数据ImageData此处要重点关注文件头，后续实验中会根据文件头信息判断是否为bmp文件2.位图文件头BITMAPFILEHEADER3.位图信息头BITMAPINFOHEADER4.重点关注bmp文件的

2021-04-04 21:52:51 249

原创 PNG文件格式解析

1.引言PNG是一种采用无损压缩算法的位图格式，其设计目的是试图替代GIF和TIFF文件格式，同时增加一些GIF文件格式所不具备的特性。PNG使用从LZ77派生的无损数据压缩算法，一般应用于JAVA程序、网页或S60程序中，原因是它压缩比高，生成文件体积小。PNG格式的文件后缀为“.png”。PNG文件格式分为PNG-24和PNG-8，其最大的区别是PNG-24是用24位来保存一个像素值，是真彩色，而PNG-8是用8位索引值来在调色盘中索引一个颜色，因为一个索引值的最大上限为2的8次方既128，故调色盘

2021-03-24 17:06:45 4158

原创 YUV2与RGB图像变换

实验目标使用c以及c++语言编写色彩空间的转换，利用YUV文件转换为RGB文件并比较不同。实验原理1.YUV与RGB空间的相互转换由电视原理可知，亮度和色差信号的构成如下：Y＝0.2990R+0.5870G+0.1140BR-Y＝0.7010R-0.5870G-0.1140BB-Y＝0.2990R+0.5870G+0.8860B为了使色差信号的动态范围控制在0.5之间，需要进行归一化，对色差信号引入压缩系数。归一化后的色差信号为：U＝0.1684R+0.3316G+0.5BV＝0.5R-

2021-03-21 22:56:07 961

原创关于对RGB以及YUV文件三色通道概率的计算以及对其熵的计算

一.实验目的通过对所给rgb文件以及yuv文件三个通道进行分析，分别计算出各自的概率以及对应的熵，由此来判断压缩时选择什么文件更利于文件的压缩。二.实验思路1.rgb文件所给的内容是按照BGRBGRBRG…的方式排列，首先读取文件将文件完全展开变为一个256×256×3一维数组，由于每一位都是由8bit组成，即RGB每种颜色都有256种色号，将单独每一路通道的颜色取出，即变成3个256×256的一维数组，通过对数组的遍历对每一种色号进行统计计算出每种色号的概率，从而得到其熵值。（由于程序中不方便对公式

2021-03-09 21:25:55 528 1

原创语音信号的分析

短时平稳性贯穿于语音分析全过程的是“短时分析技术”。语音信号从整体来看其特征及表征其本质特征的参数均是随时间变化而变化的，所以它是一个非平稳过程，不能用处理平衡信号的数字信号处理技术对其进行分析。但在一个短时间的范围内（一般认为10-30ms的短时间内），其特性基本保持不变，即相对稳定，因而可以将其看作是一个准稳态过程，基于语音信号具有短时平稳性。（以下实验均视为在10-30ms范围内进行分析）爆破音/p/时域分析图频域分析图爆破音在时域上会有一个较明显的聚集能量的过程，随后释..

2021-03-09 17:21:31 1066

Mr_Starlna的博客