自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 第九次作业——码流分析仪

H.264是国际标准化组织(ISO)和国际电信联盟(ITU)在2002年12月共同提出的继MPEG-4之后的新一代数字视频压缩格式,其具有更高的编码效率,并注重对移动和IP网络的适应,考虑信道的特点,能控制误码扩散。(1) 分层设计H.264在视频编码层(VCL)和网络提取层(NAL)之间进行概念分割,以实现在不同的传输环境下的有效传输,便于与当前和将来的编码格式和不同类型的网络进行无缝连接。分层结构如图所示。根据邻近块的值来预测当前宏块的值,再对预测值和原始值的差值进行变换、量化和编码。对于亮度块,使用4

2022-06-30 23:36:40 576 1

原创 第八次作业——MPEG音频编码

输入为PCM信号,采样率为32、44.1或48kHz,输出为32kbps~384kbps具有三个独立的压缩层次:layerⅠ(编码器最简单)、layerⅡ(编码器复杂度中等)、layerⅢ(编码器最复杂)心理声学模型用来计算信号中不可被听觉感知的部分人耳听觉系统大致等效于一个信号通过一组并联的不同中心频率的带通滤波器,中心频率与信号频率相同的滤波器具有最大响应,中心频率偏离信号频率较多的滤波器不会产生响应。在0Hz到20kHz频率范围内由25个重叠的带通滤波器组成滤波器组。听觉系统中存在一个听觉阈值电平,低

2022-06-30 16:15:37 502 1

原创 第七次作业——JPEG原理分析及JPEG解码器的调试

​(1)零偏置电平下移(Level Offset)对于灰度级为2^n 的像素,通过减去2^(n-1),将无符号整数变为有符号数,即值域变为正负对称。将绝对值大的数出现的概率大大减小,提高编码效率。(2)离散余弦变换(8×8 DCT)先将图像分为8×8的像块,如果图像的宽(高)不是8的整数倍,使用图像边缘像素填充,以不改变频谱分布。然后对每一个子块进行DCT(Discrete Cosine Transform)。DCT变换使用下式计算,C为变换核矩阵:​实现能量集中和去相关,便于去除空间冗余,提高编码效率

2022-06-29 20:44:12 257

原创 第六次作业:DPCM压缩系统

​ 在本次实验中,我们采用固定预测器和均匀量化器。在DPCM编码器实现的过程中可同时输出预测误差图像和重建图像。将预测误差图像写入文件并将该文件输入Huffman编码器,得到输出码流、给出概率分布图并计算压缩比。将原始图像文件输入Huffman编码器,得到输出码流、给出概率分布图并计算压缩比。最后比较两种系统(1.DPCM+熵编码和2.仅进行熵编码)之间的编码效率(压缩比和图像质量)。压缩质量以PSNR进行计算。 PNSR(Peak Signal to Noise Ratio),即峰值信噪比,计算公式如下

2022-06-26 21:21:01 161

原创 第五次作业:LZW编码

LZW的编码思想是不断地从字符流中提取新的字符串,通俗地理解为新 “ 词条 ” ,然后用 “ 代号 ” 也就是码字表示这个 “ 词条 ” 。这样一来,对字符流的编码就变成了用码字去替 换字符流,生成码字流,从而达到压缩数据的目的。 LZW编码是围绕称为词典的转换表来完成的, LZW 编码器通过管理这个词典完成输入与输出之间的转换。 LZW编码器的输 入是字符流,字符流可以是用 8 位 ASCII 字符组成的字符串,而输出是用 n 位 ( 例如 12 位 ) 表示的码字流。

2022-06-26 17:25:42 370

原创 第四次作业——BMP2YUV

典型的BMP图像文件由四部分组成:(1)位图头文件数据结构,它包含 BMP 图像文件的类型、显示内容等信息;(2)位图信息数据结构,它包含有 BMP 图像的宽、高、压缩方法,以及定义颜色等信息:(3)调色板,这个部分是可选的,有些位图需要调色板,有些位图,比如真彩色图(24位的 BMP)就不需要调色板:(4)位图数据,这部分的内容根据 BMP 位图使用的位数不同而不同,在 24 位图中直接使用 RGB,而其他的小于 24 位的使用调色板中颜色索引值。打开实验BMP文件: “42 4D”:说

2022-06-25 16:19:59 89

原创 第三次作业:AVI和WAV格式文件分析

AVI文件格式 AVI英文全称为Audio Video Interleaved,即音频视频交错格式,是微软公司于1992年11月推出、作为其Windows视频软件一部分的一种多媒体容器格式。AVI文件将音频(语音)和视频(影像)数据包含在一个文件容器中,允许音视频同步回放。类似DVD视频格式,AVI文件支持多个音视频流。AVI信息主要应用在多媒体光盘上,用来保存电视、电影等各种影像信息。 AVI文件类型用一个四字符码‘AVI ’来表示。整个AVI文件的结构为:一个RIFF头...

2022-05-12 21:20:54 470

原创 第二次作业:PNG图像文件格式分析

1.PNG格式简介png(便携式网络图形)是一种采用无损压缩算法的位图格式,其设计目的是试图替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性。PNG使用从LZ77派生的无损数据压缩算法,一般应用于JAVA程序、网页或S60程序中,原因是它压缩比高,生成文件体积小。数据块结构PNG图像格式文件(或者称为数据流)由一个8字节的PNG文件署名(PNG file signature)域和按照特定结构组织的3个以上的数据块(chunk)组成。PNG定义了两种类型的数据块,一种

2022-04-17 18:42:17 545

原创 第一次作业:音频分析与RGB文件熵的计算

浊音/a:/时域波形:频谱:分析:一般将发声时声带振动的音称为浊音。 观察可以发现浊音的时域波形在短时内具有周期性。 在相同时间尺度内,过零点最少,过零率低。 相比清音、爆破音,波形幅度更大,整体能量更高一些。 在某些频率上具有集中的高能量,即有共振峰(Formant)的特征。 整体能量集中分布在频率较低的部分,高频部分极少。清音/s:/时域波形:频谱:分析:发音时声带不振动的音称为清音。 短时内接近高斯过程,类似白噪声。 在相同...

2022-04-17 17:10:39 247

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除