自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 H.264编码

码流分析实验目的:分析SPS和PPS里都包含哪些主要的信息,给出参数值。以一个GOP为例,分析如下信息:每个图像帧的类型及所用的编码比特数、QP值;并以图像帧号为横坐标、每帧所用比特数为纵坐标画出曲线图;以图像帧号为横坐标、每帧所用QP为纵坐标画出曲线图。以第一个I帧作为分析对象,基于该帧图像的空间特性,分析每个宏块所采用的编码类型及其比例。以第一个P帧作为分析对象,基于该帧图像的空间和时间特性,分析每个宏块所采用的编码类型及其比例。以某一个B帧作为分析对象,基于该帧图像的空间和时间特性,分

2021-07-16 20:27:06 161

原创 MPEG音频编码

实验原理MPEG音频编码原理框图MPEG-I 心理声学模型,根据人耳的听觉阈值和听觉掩蔽特性建立的模型,可以通过这个模型消除更多的冗余数据,计算信号中不可听觉感知的部分。多相滤波器组(Polyphase Filter Bank):将PCM样本变换到32个子带的频域信号,如果输入的采样频率为48kHz,那么子带的频率宽度为48/(2*32)=0.75Hz比例因子提取、比例因子选择:每个子带每12个样点为一个数据块,一个子带含有3个数据块,将这三个数据块的比例因子进行提取并比较。若相差不大,则使用统

2021-06-17 20:03:01 232

原创 JPEG原理分析及 JPEG 解码器的调试

一、实验原理JPEG文件格式JPEG(Joint Photographic Experts Group)是JPEG标准的产物,该标准由国际标准化组织(ISO)制订,是面向连续色调静止图像的一种压缩标准。主要采用预测编码(DPCM)、离散余弦变换(DCT)以及熵编码的联合编码方式,以去除冗余的图像和彩色数据,属于有损压缩格式,它能够将图像压缩在很小的储存空间,一定程度上会造成图像数据的损伤。尤其是使用过高的压缩比例,将使最终解压缩后恢复的图像质量降低,如果追求高品质图像,则不宜采用过高的压缩比例。

2021-06-17 14:47:57 406

原创 随机信号的参数建模法(验证)

随机信号的参数建模法一、参数模型为随机信号建立参数模型是研究随机信号的一种基本方法,其含义是认为随机信号x(n)是由白噪w(n)激励某一确定系统的响应(如图)。只要白噪的参数确定了,研究随机信号就可以转化成研究产生随机信号的系统。对平稳随机信号,三种常用的线性模型分别是 AR 模型(自回归模型 Auto-regression model),MA 模型(滑动平均模型 Moving average model)和 ARMA 模型(自回归滑移平均模型 Auto-regression-Moving a

2021-06-06 18:02:11 534

原创 DPCM 压缩系统的实现和分析

实验目的掌握DPCM编解码系统的基本原理。初步掌握实验用C/C++/Python等语言编程实现DPCM编码器,并分析其压缩效率。实验原理DPCM编解码原理DPCM是差分预测编码调制的缩写,是比较典型的预测编码系统。在DPCM系统中,预测器的输入是已经解码以后的样本。因为在解码端无法得到原始样本,只能得到存在误差的样本。因此,在DPCM编码器中实际内嵌了一个解码器,如编码器中虚线框中所示。在一个DPCM系统中,有两个因素需要设计:预测器和量化器。理想情况下,预测器和量化器应进行联合优化。实

2021-04-28 14:48:58 103

原创 LZW 编解码算法实现与分析

实验目的掌握词典编码的基本原理,用C/C++/Python等语言编程实现LZW解码器并分析编解码算法。LZW编码原理和实现算法LZW的编码思想是不断地从字符流中提取新的字符串,通俗地理解为新“词条”,然后用“代号”也就是码字表示这个“词条”。这样一来,对字符流的编码就变成了用码字去替换字符流,生成码字流,从而达到压缩数据的目的。LZW编码是围绕称为词典的转换表来完成的。LZW编码器通过管理这个词典完成输入与输出之间的转换。LZW编码器的输入是字符流,字符流可以是用8位ASCII字符组成的字符串,

2021-04-21 15:39:29 138

原创 BMP 序列转 YUV 文件

实验要求:(1)在图像处理软件中自行生成多个BMP文件,至少含5个不同的场景画面,要求带含有班级、学号后四位和本人姓名(缩写或昵称均可)的logo。(基本要求为24bit的BMP,进阶要求为支持小于24bit的BMP。)(2)编写将第一步所生成的多个BMP文件转化为YUV文件,要求可在命令行中设置每个画面出现的帧数。最后形成的YUV文件应至少包含200帧。重点掌握函数定义、缓冲区分配、倒序读写、结构体的操作。(3)对整个程序进行调试,并将生成的YUV文件用播放软件观看,验证是否正确。BMP文件的组成

2021-04-07 20:05:48 256

原创 对TGA图像文件格式的理解

一、什么是TGA格式TGA格式的定义TGA是由美国Truevision公司为其显示卡开发的一种图像文件格式,已被国际上的图形、图像工业所接受。现已成为数字化图像,以及运用光线跟踪算法所产生的高质量图像的常用格式。TGA文件的扩展名为.tga,该格式支持压缩,使用不失真的压缩算法,可以带通道图,另外还支持行程编码压缩。TGA格式的特点TGA(Targa)格式是计算机上应用最广泛的图象格式。在兼顾了BMP的图象质量的同时又兼顾了JPEG的体积优势。并且还有自身的特点:通道效果、方向性。在CG领域常作为

2021-03-24 18:12:58 1191

原创 彩色空间转化——RGB与YUV的转换

一、原理分析由现代电视原理知识可知亮度和色差计算公式为:Y=0.2990R+0.5870G+0.1140BR-Y=0.7010R-0.5870G-0.1140BB-Y=-0.2990R-0.5870G+0.8860B为使色差信号的动态范围控制在-0.5~+0.5之间,要对色差信号进行归一化处理,引入压缩系数后可以得到U、V的计算公式:U=-0.1684R-0.3316G+0.5BV=0.5R-0.4187G-0.0813B此时得到的U、V范围在-128~127之间,为了避免出现负数,

2021-03-23 19:24:47 1020

原创 RGB和YUV格式三通道的概率分布和计算各自的熵

作业要求对老师提供的的down.rgb和down.yuv分析三个通道的概率分布,并计算各自的熵。(编程实现)两个文件的分辨率均为256*256,yuv为4:2:0采样空间,存储格式为:rgb文件按每个像素BGR分量依次存放;YUV格式按照全部像素的Y数据块、U数据块和V数据块依次存放。作业分析文件分辨率为256*256。rgb文件:每个像素BGR依次存放,故编程中须分配空间为256* 256* 3=196608;yuv文件:4:2:0的采样空间,则依次存储y分量256* 256=65536,u分

2021-03-08 20:39:30 273

原创 使用Audacity分析浊音、清音、爆破音的时域和频域特性

浊音a时域图频域图分析放大后观察出浊音在时域显示出一定的周期性。由频域图则可看出浊音整体能量较大且主要集中于低中频部分,具有共振峰特性。清音s时域图频域图分析清音在时域上具有较强的随机性。频谱图显示能量主要集中在低高频部分,中频区较弱。爆破音p时域图频域图分析时域图显示爆破音在在较短的时间内幅度有明显波动。频域图则显示爆破音的能量从低频到高频呈递减趋势。...

2021-03-08 19:22:23 230

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除