自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 Lab8-2 H.264编码实验——程序实现

Lab8-2 H.264编码实验——程序实现一、实验要求二、实验过程1、使用ldecod_vc10的工程文件将highway_qcif.264和test.264进行解码,以得到yuv文件。已知highway_qcif.264和test.264的图像宽高均为176x144。(使用上一篇Lab8-1 H.264编码实验——软件分析中所使用的码流分析软件得到)命令行参数设置:将decoder.cfg分别修改为:得到输出:2、将刚刚得到的两个YUV文件按照不同要求编码为264文件。

2021-06-28 22:25:08 239

原创 Lab8-1 H.264编码实验——软件分析

Lab8-1 H.264编码实验——软件分析一、实验要求选择一个.mp4或者.264文件,在码流分析仪软件中打开该文件,从下面几个层次进行分析:分析SPS和PPS里都包含哪些主要的信息,给出参数值。以一个GOP为例,分析如下信息:每个图像帧的类型及所用的编码比特数、QP值;并以图像帧号为横坐标、每帧所用比特数为纵坐标画出曲线图;以图像帧号为横坐标、每帧所用QP为纵坐标画出曲线图。以第一个I帧作为分析对象,基于该帧图像的空间特性,分析每个宏块所采用的编码类型及其比例。以第一个P帧作为分析对象,

2021-06-28 17:12:51 331

原创 Lab6 MPEG音频编码实验——C++代码实现

Lab6 MPEG音频编码实验——C++代码实现一、MPEG音频编码实现框架及思路1、MPEG音频编码实现框图:MPEG音频编码的实现主要分为上下两条线,上方红色框中的部分属于时域分析(粗细节),下方蓝色框中的部分属于频域分析(细细节)。其中主要模块的作用分别是:心理声学模型:依据人耳听觉阈值和听觉掩蔽特性建立,分析听阈曲线,保证满足人耳听觉感受的前提下,减少码率。动态比特分配:根据目标码率和心理声学模型分析的结果,为子带分配最合理的量化比特数,使整帧和每个子带的噪掩比NMR最小的算法。(该信

2021-06-06 15:11:25 436

原创 随机信号的参数建模法——matlab程序验证

随机信号的参数建模法——matlab程序验证一、理论基础1、维纳滤波器——用来从噪声中提取信号X(n)=s(n)+v(n) s(n)是信号,v(n) 是噪声。希望x(n)经过线性时不变系统后得到的y(n)尽可能接近于s(n),这个线性时不变系统就叫做维纳滤波器、维纳滤波器三种类型滤波(过滤):利用直到当前时刻的随机过程的观察值,得到当前信号值的估计。平滑(内插):利用直到当前时刻的随机过程的观察值,得到过去某个时刻信号值的估计。预测(外推):利用直到当前时刻的随机过程的观察值,得到

2021-06-01 16:37:46 565

原创 Lab5 JPEG原理分析及JPEG解码器的调试——C++代码实现

Lab5 JPEG原理分析及JPEG解码器的调试——C++代码实现一、JPEG编解码原理JPEG是一种针对数字图像的有损压缩标准方法,由于JPEG编码算法可以在提供较大的压缩比的同时,保持较好的显示质量,所以该算法逐渐成为最为熟知和广泛使用的数字图像格式和通用标准。JPEG编码器的系统原理框图如下:其中各环节的作用分别是:零偏置:对于灰度级为2n 的像素,通过减去2(n-1),将无符号整数变为有符号数,以将绝对值大的数出现的概率大大减小,提高编码效率。8*8DCT变换:对每个单独的彩色图像分

2021-06-01 14:29:26 1041

原创 Lab4 DPCM 压缩系统的实现和分析——C语言代码实现

Lab4 DPCM 压缩系统的实现和分析——C语言代码实现一、实验原理原理实现框图如下:将输入的像素值与前一个像素值的预测值作差,并对差值进行编码编码后的差值一路直接输出编码后的差值另一路通过解码器解出差值,并与前一个像素的预测值相加,得到当前像素的预测值需要注意的是:在DPCM编码器中实际内嵌了一个解码器,如编码器中虚线框中所示。举例说明:二、实验内容实验目标:验证DPCM编码的编码效率。先读取一个256级的灰度图像根据自己设定的预测方法计算预测误差,并进行量化在DPCM

2021-04-23 11:46:39 249

原创 Lab3 LZW 编解码算法实现与分析——C语言代码实现

Lab3 LZW 编解码算法实现与分析——C语言代码实现一、实验步骤首先调试LZW的编码程序,以一个文本文件作为输入,得到输出的LZW编码文件。将得到的编码文件作为输入文件,编写LZW的解码程序。选择至少十种不同格式类型的文件,使用LZW编码器进行压缩得到输出的压缩比特流文件,并对各种不同格式的文件进行压缩效率的分析。二、实验原理(一)编码原理LZW算法编码基本思想:初始化包含单字符的词典表判断输入数据流中的当前字符串是否在词典表中若在词典中,则继续读取输入数据若不在词典中,则将

2021-04-14 17:05:37 237

原创 Lab2 bmp文件与yuv文件的转换——C语言代码实现

Lab2 bmp文件与yuv文件的转换——C语言代码实现一、实验内容自行生成多个BMP文件,至少含5个不同的场景画面,要求带含有班级、学号后四位和本人姓名(缩写或昵称均可)的logo。编写代码实现将第一步所生成的多个BMP文件转化为YUV文件,要求可在命令行中设置每个画面出现的帧数,且最后形成的YUV文件应至少包含200帧。对整个程序进行调试,并将生成的YUV文件用播放软件观看,验证是否正确。已知:自行生成了6个bmp文件每个bmp文件均为256*256每个bmp文件均为32bit深度

2021-03-26 18:04:46 408

原创 2.1 TGA图像文件格式解析

2.1 TGA图像文件格解析作业内容:使用FlexHEX对下图的TGA格式的图像进行文件格式解析。简介TGA(Truevision Graphics Adapter)文件格式,通常又称为Targa(Truevision Advanced Raster Graphics Adapter),是由Truevision公司于1984年创建。TGA文件格式可用于存储8位、15位、16位、24位、32位图像数据,支持alpha通道、颜色索引、RGB颜色、灰度图、行程压缩算法(RLE)、开发者自定义区、缩略图

2021-03-22 18:46:48 1474

原创 Lab1 RGB与YUV彩色空间的转换——C语言代码实现

Lab1 RGB与YUV彩色空间的转换——C语言代码实现一、实验内容1、理解并调试老师所给的RGB2YUV的转换过程,掌握关键代码的实现思路。2、仿照所给示例,自己编写RGB2YUV的转换代码,并使用YUVviewerPlus进行验证。3、自行完成YUV2RGB的转换过程,并进行误差分析。已知:down.rgb和down.yuv分辨率为256*256yuv为4:2:0采样空间存储格式为:rgb文件按每个像素BGR分量依次存放;YUV格式按照全部像素的Y数据块、U数据块和V数据块依次存放

2021-03-19 14:07:30 1646

原创 1.2 分析RGB和YUV文件三个通道的概率分布,并计算各自的熵(编程实现)

1.2 分析RGB和YUV文件三个通道的概率分布,并计算各自的熵(编程实现)一、作业要求分析down.rgb和down.yuv三个通道的概率分布,并计算各自的熵。两个文件的分辨率均为256*256。yuv为4:2:0采样空间。rgb文件按每个像素BGR分量依次存放;YUV格式按照全部像素的Y数据块、U数据块和V数据块依次存放。二、分析思路(一)RGB文件“rgb文件按每个像素BGR分量依次存放”,即文件中的数据为BGRBGR……“文件的分辨率均为256256”,即R、G、B分别有25

2021-03-08 20:16:10 256

原创 1.1 利用Audacity分析语音信号

利用Audacity分析语音信号自己录制清音、浊音、爆破音的音频文件,利用Audacity软件对录好的音频文件进行时域及频域分析。(提示:Audacity处理WAV格式的语音文件。)通过数字视音频处理课程所学内容可知:语音信号从整体来看其特征及表征参数是随时间变化的非平稳过程,但由于人的口腔肌肉运动构成声道的某种形状产生的响应形成了语音,而这种运动较声音频率来说变化非常缓慢,所以虽然语音信号具有时变性,但在短时内(一般10~30ms)其特性基本保持不变,即可看作准稳态过程。也就是语音信号具有短时平稳性。

2021-03-06 13:16:43 1083

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除