自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 第七次实验:H.264码流分析

实验目的用码流分析仪H264Visa、Elecard StreamEye Tools打开一个.mp4或.264文件,从SPS、PPS、GOP中I、P、B帧的层次进行码流分析。分析sps、ppsSPSprofile_idc和level_idc是指比特流所遵守的配置和级别。constraint_set0_flag 等于1是指比特流遵从某节中的所有规定。constraint_set0_flag 等于0是指该比特流可以遵从也可以不遵从某节中的所有规定。当profile_idc等于100、110、122或144时,

2022-07-08 13:20:18 253

原创 第六次实验:MPEG音频编码

临界频带临界频带是指当某个纯音被以它为中心频率,且具有一定带宽的连续噪声所掩蔽时,如果该纯音刚好被听到时的功率等于这一频带内的噪声功率,这个带宽为临界频带宽度。通常认为从20Hz到16kHz有25个临界频带,单位为bark,1bark=一个临界频带的宽度。掩蔽值掩蔽音与被掩蔽音的组合方式有四种,即它们分别可以是乐音信号或窄带噪声。音乐与语音信号大都由一系列复杂的频谱分量构成,相应的这些多个掩蔽分量也会相互影响并最终获得一个整体的掩蔽阈值。多个掩蔽音同时存在时的综合掩蔽效果可以理解为每个掩蔽音的掩蔽效果先

2022-07-07 21:18:54 119

原创 第五次实验:JPEG原理分析

JPEG概述JPEG( Joint Photographic Experts Group)即联合图像专家组,是用于连续色调静态图像压缩的一种标准,文件后缀名为.jpg或.jpeg,是最常用的图像文件格式。其主要是采用预测编码(DPCM),离散余弦变换(DCT)以及熵编码的联合编码方式,以去除冗余的图像和彩色数据,属于有损压缩格式,它能够将图像压缩在很小的储存空间,一定程度上会造成图像数据的损伤。JPEG编码原理JPEG编码的主要步骤为:零电平偏置,DCT变换,量化;对于DC系数来说,进行DPCM+Huffm

2022-07-03 14:43:15 112

原创 第四次实验:DPCM编码

实验目的:掌握DPCM编解码系统的基本原理。初步掌握实验用C/C++/Python等语言编程实现DPCM编码器,并分析其压缩效率。DPCM编码原理: 在一个DPCM系统中,需要设计预测器和量化器两部分,在本次实验中,采用固定预测器和均匀量化器代码部分:dpcm编码psnr代码实验结果及分析:8bit:4bit : 2bit: 1、从预测误差图像概率分布与原始图像的概率分布对比可以看出,预测误差图像的概率分布更集中,大部分像素都集中在灰度值为100-150之间,像素之间的关联性更高

2022-07-03 14:19:10 306

原创 第三次实验:LZW编码

LZW编码概述LZW的编码思想是不断地从字符流中提取新的字符串,通俗地理解为新 “ 词条 ” ,然后用 “ 代号 ” 也就是码字表示这个 “ 词条 ” 。这样一来,对字符流的编码就变成了用码字去替 换字符流,生成码字流,从而达到压缩数据的目的。LZW编码是围绕称为词典的转换表 来完成的, LZW 编码器通过管理这个词典完成输入与输出之间的转换。LZW编码器的输 入是字符流,字符流可以是用 8 位 ASCII 字符组成的字符串,而输出是用 n 位 ( 例如 12 位 ) 表 示的码字流。相比于Huffm

2022-07-03 12:22:57 364

原创 第四次作业:BMP转YUV

BMP(全称Bitmap)是Windows操作系统中的标准图像文件格式,可以分成两类:设备相关位图(DDB)和设备无关位图(DIB),使用广泛。它采用位映射存储格式,除了图像深度可选以外,在绝大多数应用中不采用其他任何压缩,因此,BMP文件所占用的空间很大。BMP文件的图像深度可选lbit、4bit、8bit、16bit及24bit。BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。由于BMP文件格式是Windows环境中交换与图有关的数据的一种标准,因此在Windows环境中运行的图形图像

2022-07-02 17:11:25 58

原创 第三周作业:wav文件分析

WAV格式简介WAV是最常见的声音文件格式之一,是微软公司专门为Windows开发的一种标准数字音频文件,该文件能记录各种单声道或立体声的声音信息,并能保证声音不失真。它符合资源互换文件格式(RIFF)规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。Wave格式支持MSADPCM、CCITT A律、CCITT μ律和其他压缩算法,支持多种音频位数、采样频率和声道,是PC机上最为流行的声音文件格式;但其文件尺寸较大,多用于存储简短的声音片段。WAV的文件结构:W

2022-07-02 16:48:56 83

原创 第二次作业:PNG图像文件格式分析

PNG(可移植网络图形),是一种可扩展的文件格式,用于光栅图像的无损、可移植、压缩良好的存储。PNG是一种无损压缩的位图图形格式。其设计目的是试图替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性。PNG格式有8位、24位、32位三种形式,其中8位PNG支持两种不同的透明形式(索引透明和alpha透明),24位PNG不支持透明,32位PNG在24位基础上增加了8位透明通道,因此可展现256级透明程度。关键数据块:文件头数据块(IHDR)、调色板数据块(PLTE)、图像数据块(IDAT)、

2022-07-02 16:34:22 277

原创 第一次实验——Audaity音频文件分析与RGB文件熵计算

浊音[a]时域 频谱分析:浊音的时域波形在短时内具有周期性,在相同时间尺度内,过零点最少,过零率低。整体能量集中分布在频率较低的部分,高频部分极少,有共振峰。相比之下能量最高。清音[s]时域 频谱分析:短时内接近高斯过程,类似白噪声,在相同时间尺度内,过零点高,过零率比较高。能量集分布在频率较低和高频部分,中间频率的能量较低。相比之下能量最低。爆破音[p]时域 频谱分析:可以观察出波形在短时内快速衰减,幅度逐渐降低。过零率介于清浊音之间。能量整体呈现低频到高频下降的趋势。熵的计算公式: 代码:输出结

2022-07-02 15:47:01 124

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除