自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 H.264编解码分析

H.264编解码分析一、关于视频编码首先我们需要知道为什么我们需要视频编码呢?因为视频信号所包含的信息量巨大,显然我们现在的网络情况是远远不能满足的,我们需要通过编码压缩视频,节省对传输带宽和储存空间的需求,以便于在网络上进行传送。视频是由图像组成的。而图像则是由一个个像素组成的,而一个像素,可以通过 R/G/B 三种颜色的值来表达,也可以通过YUV表达 。其中,Y 是明亮度,用来表示像素的灰度值;U、V 分别是影像色彩与饱和度,用来表示像素的颜色。在视频编码的过程中,视频不直接使用RGB而是用Y

2021-07-10 20:34:01 648

原创 H.264格式分析

几乎所有视频编码标准的编码结构都是基于树状的分层结构,如图像组层,图像层,片层,宏块层和块层。在以往的标准中,每一层都有头部信息描述该层中的重要信息,数据部分包含该层的数据。一旦头部信息丢失,就会导致该层及以下各层的所有数据不可用◼ 将片层以上很少变化的系统级信息放在序列参数集(Sequence parameter set, SPS)和图像参数集(Picture parameter set,PPS)中传送◼ 由于参数集中的信息大多是系统级信息,与图像具体内容不相关,因此需要在编解码端建立会话连接时进行.

2021-06-24 16:17:34 388

原创 MPEG音频编码及分析

MPEG音频编码一、MPEG-I心理声学模型MPEG-I 标准定义了两个模型心理声学模型1:计算复杂度低,但对假设用户听不到的部分压缩太严重心理声学模型2 :提供了适合Layer III编码的更多特征实际实现的模型复杂度取决所需要的压缩因子,如大的压缩因子不重要,则可以完全不用心理声学模型。此时位分配算法不使用SMR( Signal Mask Ratio ),而是使用SNRLayerⅠ编码:码率分配在调整到固定的码率之前先确定可用于样值编码的有效比特数这个数值取决于比例因子、比

2021-06-16 11:44:31 1190

原创 实验五-JPEG原理分析及JPEG解码器的调试

JPEG原理分析及JPEG解码器的调试一、实验简介JPEG( Joint Photographic Experts Group)是用于连续色调静态图像压缩的一种标准,文件后缀名为.jpg或.jpeg,是最常用的图像文件格式。主要采用预测编码(DPCM)、离散余弦变换(DCT)以及熵编码的联合编码方式,以去除冗余的图像和彩色数据,属于有损压缩格式。所谓有损压缩,就是把原始数据中不重要的部分去掉,以便可以用更小的体积保存。JPEG整个压缩过程遵循如下步骤:1. 把数据分为“重要部分”和“不重要部分”

2021-06-08 21:11:59 860 1

原创 DPCM 压缩系统的实现和分析

一、实验简介1.预测编码:预测编码主要是利用信源相邻符合之间的相关性。根据某一模型利用以往的样本值对新样本进行预测,然后将样本的实际值与其预测值相减得到一个误差值,最后对这一误差值进行编码。如果模型足够好,且样本序列在时间上相关性较强,则误差信号的幅度将远远小于原始信号,从而得到较大的数据压缩2.DPCM:DPCM是差分预测编码调制的缩写,是比较典型的预测编码系统。在DPCM系统中,需要注意的是预测器的输入是已经解码以后的样本。之所以不用原始样本来做预测,是因为在解码端无法得到原始样本,只能得到存

2021-04-29 16:29:34 249

原创 LZW 编解码算法实现与分析

一、实验简介1.LZW简介LZW 是一种无损数据压缩算法,对于GIF、TIFF格式等文件以及较大规模的英文文本的压缩具有良好的效果,一般可以压缩到原来大小的一半。LZW算法通过建立字典,实现字符重用与编码,适用于source中重复率很高的文本压缩。2.LZW编码LZW的编码思想是不断地从字符流中提取新的字符串,通俗地理解为新“词条”,然后用“代号”也就是码字表示这个“词条”。这样一来,对字符流的编码就变成了用码字去替换字符流,生成码字流,从而达到压缩数据的目的LZW编码是围绕称为词典的

2021-04-14 23:33:53 524

原创 编程实现将BMP序列转YUV文件

一、实验目的1.理解图像文件的基本组成。2.掌握结构体作为复杂数据对象的用法。进一步熟悉由问题到程序的解决方案,并掌握编程细节:如内存分配、倒序读写、字节序、文件读写过程等。二、实验原理1、BMP概述位图文件(Bitmap-File,BMP)格式是Windows采用的图像文件存储格式,其位图文件默认的文件扩展名是bmp或者dib。BMP格式分析如下:数据段名称含义大小位图文件头 (BITMAPFFILEHEADER)提供文件类型、大小等信息14字节位图信息

2021-03-28 15:11:11 130

原创 PNG格式分析

一、PNG概述PNG,图像文件存储格式,其设计目的是试图替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性。PNG的名称来源于“可移植网络图形格式(Portable Network Graphic Format,PNG)”,也有一个非官方解释“PNG’s Not GIF”,是一种位图文件(bitmap file)存储格式,读作“ping”。PNG用来存储灰度图像时,灰度图像的深度可多到16位,存储彩色图像时,彩色图像的深度可多到48位,并且还可存储多到16位的α通道数据。PNG图片

2021-03-24 16:19:21 586

原创 彩色空间转换

编程实现YUV与RGB空间的互换1.基本要求(必做):编写RGB转化为YUV程序,重点掌握函数定义,部分查找表的初始化和调用,缓冲区分配。将得到的RGB文件转换为YUV文件,用YUV Viewer播放器观看,验证是否正确。2.提高要求(可选):编写将YUV转换为RGB的程序。将给定的实验数据用该程序转换为RGB文件。并与原RGB文件进行比较,如果有误差,分析误差来自何处一、实验目的1、学会从计算和程序的角度分析问题2、进一步理解彩色空间的概念并掌握不同彩色空间转换的基本方程3、通过逐步设计

2021-03-19 11:42:42 197

原创 分析rgb文件和yuv文件概率及各自的熵

通过CPP编程分析rgb文件和yuv文件*已知文件down.rgb和down.yuv两个文件分辨率均为256*256yuv为4:2:0采样空间存储格式为:rgb文件按每个像素BGR分量依次存放;YUV格式按照全部像素的Y数据块、U数据块和V数据块依次存放一、实验目的已知文件down.rgb和down.yuv两个文件,通过编程分析二者的三个通道的概率分布,并计算各自的熵。二、实验流程打开、创建所需文件定义文件读取、存储数组计算三通道数值的出现概率定义并求解三通道信源熵...

2021-03-10 16:15:43 203 2

原创 浊音、清音、爆破音音频分析

浊音、清音、爆破音的音频分析一、浊音:*以d为例1、时域分析由观察可得,浊音d的时域波形分布较为均匀,可认为均匀分布,且具有短时周期性。(下图为进一步放大后观察结果)2、频域分析能量集中在200~2000hz。波形起伏较大,波峰较多。由1dB=10*lg(S/N)可知二、清音以s为例1、时域分析具有类似高斯噪声的特点2、频域分析能量集中在76~2857hz,波形较为平缓,与爆破音及浊音相比,波形起伏最小,基本没有波峰。三、爆破音*以k为例1、时域分析2、频

2021-03-08 22:37:50 1750

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除