- 博客(9)
- 收藏
- 关注
原创 数据压缩实验八:MPEG音频压缩编码
将PCM样本变换到32个子带的频域信号。如果输入的采样频率为48kHz,那么子带的频率宽度为48kHz/(2*32)=0.75kHz。计算信号中不可听觉感知的部分。根据心理声学模型的计算结果,为每个子带信号分配比特数。产生MPEG-I兼容的比特流①以1152个样本为单位,输入到滤波器组中分解为32个子带,以32个样本为一个时间窗口形成36个样本,形成以12个样本为单位的3个块,再进行比例因子的提取,通过频域分析线路的辅助,进行后续的量化等工作。也即绝对阈值。...
2022-07-18 16:09:03 690 2
原创 数据压缩实验五:JPEG原理分析及解码器调试
JPEG是JointPhotographicExpertsGroup的缩写,即ISO和IEC联合图像专家组,负责静态图像压缩标准的规定。这个专家组开发的算法称为JPEG算法,并已成为当前的通用标准,即JPEG标准。遵照JPEG标准建立的图像文件使用的格式称为JFIF格式,文件名称的后缀为“.jpg”或者“.jpeg”。JPEG主要是采用预测编码(DPCM)、离散余弦变换(DCT)以及熵编码的联合编码方式,以去除冗余的图像和彩色数据,属于有损压缩格式,它能够将图像压缩在很小的储存空间,一定程度上会造成图。..
2022-07-17 22:19:32 578
原创 数据压缩实验四:DPCM压缩系统的实现和分析
DPCM是差分预测编码调制的缩写,是比较典型的预测编码系统。在DPCM系统中,需要注意的是预测器的输入是已经解码以后的样本。之所以不用原始样本来做预测,是因为在解码端无法得到原始样本,只能得到存在误差的样本。因此,在DPCM编码器中实际内嵌了一个解码器,如编码器中虚线框中所示。在一个DPCM系统中,有两个因素需要设计预测器和量化器。理想情况下,预测器和量化器应进行联合优化。实际中,采用一种次优的设计方法分别进行线性预测器和量化器的优化设计。......
2022-07-17 18:44:53 286
原创 数据压缩实验七:H.264码流分析
GOP(GroupofPictures,图像组)是将一个图像序列中连续的几个图像组成的一个小组,是对编码后的视频码流进行编辑、存取和压缩编码的基本单元,包含不同种类编码的帧。增大GOP或提高GOP中P/B帧的占比,可以提高压缩比,降低码率。因此一般而言,在码率一定的条件下,GOP越大,图像质量越好(P/B帧的比重更大);在图像质量一定的条件下,GOP越大,码率越低。...
2022-07-17 02:27:41 948
原创 数据压缩实验三:LZW编解码算法实现
1.1LZW的编码思想不断地从字符流中提取新的字符串,通俗地理解为新“词条”,然后用“代号”也就是码字表示这个“词条”。这样一来,对字符流的编码就变成了用码字去替换字符流,生成码字流,从而达到压缩数据的目的。LZW编码是围绕称为词典的转换表来完成的。LZW编码器通过管理这个词典完成输入与输出之间的转换。LZW编码器的输入是字符流,字符流可以是用8位ASCII字符组成的字符串,而输出是用n位(例如12位)表示的码字流。1.2LZW编码算法的步骤步骤11.3LZW解码原理和实现算法。......
2022-07-14 21:13:07 596
原创 数据压缩实验二:BMP转YUV序列
1.1 理解图像文件的基本组成。1.2 掌握结构体作为复杂数据对象的用法。进一步熟悉由问题到程序的解决方案,并掌握编程细节:如内存分配、倒序读写、字节序、文件读写过程等。BMP(全称Bitmap)是Windows操作系统中的标准图像文件格式,可以分成两类:设备相关位图(DDB)和设备无关位图(DIB)。采用位映射存储格式,除了图像深度可选以外,在绝大多数应用中不采用其他任何压缩,因此,BMP文件所占用的空间很大。BMP文件的图像深度可选lbit、4bit、8bit、16bit及24bit。BMP文件存储数据
2022-07-13 17:04:32 172
原创 数据压缩第三周作业:AVI和WAV文件格式分析
AVI英文全称为Audio Video Interleaved,即音频视频交错格式,是微软公司于1992年11月推出、作为其Windows视频软件一部分的一种多媒体容器格式。AVI文件将音频(语音)和视频(影像)数据包含在一个文件容器中,允许音视频同步回放。类似DVD视频格式,AVI文件支持多个音视频流。AVI信息主要应用在多媒体光盘上,用来保存电视、电影等各种影像信息。AVI文件类型用一个四字符码‘AVI ’来表示。整个AVI文件的结构为:一个RIFF头 + 两个列表(一个用于描述媒体流格式、一个用于保存
2022-07-07 09:40:41 487
原创 数据压缩第二周作业:PNG图像格式分析
png是一种无损压缩的位图片形格式。设计目的是为了替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性。 png格式是非失真性压缩的,允许使用类似于GIF格式的调色板技术,支持真彩色图像,并具备阿尔法通道(半透明)等特性。png使用从LZ77派生的无损数据压缩算法,由于它压缩比高,生成文件体积小,一般被应用于JAVA程序、网页或S60程序中。......
2022-06-24 11:30:05 155
原创 数据压缩第一周作业:元音RGB文件熵计算
一、基于audacity软件的元音分析自行录制 a、e、i三个元音,并利用audacity软件分析三个元音的时域波形和频域波形,总结其特点。1.时域和频域波形e波形i波形a波形2.分析1.时域波形:元音音频一般具有短时周期性,同时波形具有周期性,短时过零率较低。2.频域波形:存在多个共振峰,能量主要集中在较低频的范围内,由低频向高频衰减。二、RGB文件熵的计算代码如下:#include<iostream>#include<stdio.h>#includ
2022-04-05 17:47:40 246
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人