- 博客(10)
- 收藏
- 关注
原创 实验 H.264视频编解码
一、实验要求用码流分析软件检查所生成的码流中各种编码模式和运动矢量等信息。分析不同统计特性的视频图像对应的编码模式和运动矢量特点。具体要求:二、需了解的参数三、实验过程1.用码流分析软件打开一个视频文件,本实验选择Movie.mp4文件 上图显示出了此视频每一帧的数据量,红色为I帧,蓝色为P帧,绿色为B帧。由柱状图形可以直观看出I帧的数据量高于P帧、B帧,B帧为三种帧型中包含数据量最少的。由图可知,此视频序列第一个GOP包含250帧图像。2.分别以I、P、B帧作为分析对象(1)第一个I帧宏块类型: 宏块大
2022-06-25 11:31:31
507
原创 实验 MPEG音频编码实验
一、实验原理1、感知音频编码的设计思想(等响度曲线) (频域掩蔽域随声压级变化曲线)2、时域与频域的矛盾提高频率分辨率会使时间分辨率降低3、心理声学模型的实现过程(1)临界频带 (2)掩蔽值计算的思路掩蔽效果加和:多个掩蔽音同时存在的综合效果等于每个掩蔽音的掩蔽效果先独立变换再线性相加。4、码率分配5、程序设计的整体框架二、实验内容1、选择三种不同特性的音频文件:噪声、音乐、混合,输出音频的采样率和目标码率2、某个数据帧,输出三、实验过程m2aenc.cmain函数四、实验结果持续噪声 音乐
2022-06-24 22:14:55
293
原创 实验 JPEG原理分析及解码器调试
一、实验目的掌握JPEG编解码系统的基本原理。初步掌握复杂的数据压缩算法实现,并能根据理论分析需要实现所对应数据的输出。二、实验环境安装Windows和Visual Studio软件的个人计算机三、实验内容1.JPEG编解码原理图示为JPEG编码过程图,解码时编码的逆过程1)彩色空间JPEG标准本身没有规定具体的颜色空间,只是对各分量分别进行编码。实现中通常将高度相关到的RGB颜色空间转换到相关性较小的YUV颜色空间。图像的主要信息包括在Y通道,U、V更平滑,更易压缩。由于人眼对色度分量不敏感,可以对色度分
2022-06-11 14:20:32
259
原创 实验 DPCM压缩系统的实现与分析
一、实验目的掌握DPCM编解码系统的基本原理。初步掌握实验用C/C++/Python等语言实现DPCM编码器,并分析其压缩效率。二、实验环境Viisual Studio三、实验内容实验原理:本次实验采用固定预测器和均匀量化器。预测器采用左侧预测,量化器采用8比特均匀量化。左向预测:以当前像素左边的像素作为预测值,当前像素与左侧像素相减作为当前像素的预测误差。对于第一列的像素,由于左边没有像素,所以第一列像素直接输出,当前值即为预测值,第一列的所有像素预测误差为0。8bit均匀量化:图像本身是8bit,灰度值
2022-06-08 11:41:46
246
原创 实验 LZW编解码
1.LZW编码原理和实现LZW算法基于一个转换表(词典),将输入的字符串映射成定长的码字。LZW串表具有前缀性:表中任何一个字符串的前缀字符串也在表中。步骤1:编码前将词典初始化以包含所有的单字符串,当前前缀P初始化为空步骤2:将字符流中的下一个字符赋给当前字符C步骤3:判断P+C是否在词典中——在,则扩展P,P=P+C,并返回步骤2——不在,则输出与当前前缀P对应的码字W,将P+C添加到词典中,更新前缀令P=C并返回步骤2void LZWEncode( FILE *fp, B
2022-04-21 22:39:34
371
1
原创 实验 BMP2YUV
实验项目名称:图像文件的读写和转换实验目的:1.理解图像文件的基本组成。2.掌握结构体作为复杂数据对象的用法。进一步熟悉由问题到程序的解决方案,并掌握编程细节:如内存分配、倒序读写、字节序、文件读写过程等。一、BMP文件的组成结构BMP文件可以分为两类:设备相关位图(DDB)和设备无关位图(DIB)BMP文件的图像深度可选1bit、4bit、8bit、16bit及24bit。BMP文件存储数据是,图像的扫描方式是从左到右、从下到上的顺序。典型的BMP图像文件由四部分组成:(1)位图头
2022-04-07 19:01:25
152
原创 第三周 AVI、MP4、WAV文件格式
一、AVI文件打开一个AVI文件,其音频数据与视频数据是如何放置的?一个视频帧大约占据多少字节?一个音频数据块大约占据多少字节?52 49 46 46 是RIFF的ASCII码值,说明这是一个RIFF文件28 22 30 00 是用于表示文件大小的4个字节,此文件大小为0x00302228,文件大小为3154472字节,还要加上开头的8字节,所以这个文件大小实际为3154480字节。41 56 49 20 是AVI的ASCII码值,说明这是一个AVI文件4C 49 53 54
2022-03-23 20:43:03
1221
原创 第一周 清浊音时域波形与频谱分析以及计算RGB文件三通道的熵
一、清浊音时域频域分析实验软件:Audacity录制浊音a、o、e,清音t,爆破音p,分别查看其时域波形和频谱(1)a(2)o(3)e(4)t(5)p由上图可知:浊音的时域波形呈现周期性,较为规律;频域波形中有明显的共振峰。轻音与爆破音时域波形无周期性特征,轻音波形接近白噪声 。二、编程实现计算rgb文件三通道的熵测试文件分辨率为256*256,数据格式为每个像素占用3字节,以bgrbgr......的形式保存。...
2022-03-17 20:32:57
214
原创 第二周 PNG图片格式
PNG(Portable Network Graphics)便携式网格图形一种无损压缩的位图图形格式,压缩度高,生成文件体积小。采用8位调色板将RGB彩色图像转换为索引彩色图像。图像中不保存每个像素的彩色信息,而是从图像中挑选出来具有代表性的颜色编号,每一个编号对应一种颜色。PNG图像格式文件由一个8字节的PNG文件署名域(PNG file signature)和按照特定结构组织的3个以上的数据块(chunk)组成文件署名域,用来识别该文件是不是PNG文件,该域的值为:137 80.
2022-03-14 10:35:40
3473
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人