自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 H.264编码实验

一、实验目的1、将自行选择或老师给的两个264文件进行解码,得到相应的YUV文件2、将上述两个视频序列编码为.264文件固定码率,以不同的GOP长度及形状编码GOP=15,2B帧;GOP=12,2B帧,GOP=9,2B帧GOP=4,1B帧;GOP=12,无B帧;GOP=1,全I帧相同的GOP长度及形状,不同的码率例:1000kb/s, 800kb/s,400kb/s,…3、用码流分析软件检查所生成的码流中各种编码模式和运动矢量等信息4、用播放器观看所生成码流的质量5、生成率失真曲线

2021-07-13 16:50:54 99

原创 H.264文件码流分析

一、实验目的1、选择一个.mp4或者.264文件。2、在码流分析仪软件中打开该文件,从几个层次进行分析:(1)分析SPS和PPS里都包含哪些主要的信息,给出参数值。(例如分辨率、帧率、GOP结构等等)(2)以一个GOP为例,分析如下信息:每个图像帧的类型及所用的编码比特数、QP值;并以图像帧号为横坐标、每帧所用比特数为纵坐标画出曲线图;以图像帧号为横坐标、每帧所用QP为纵坐标画出曲线图。以第一个I帧作为分析对象,基于该帧图像的空间特性,分析每个宏块所采用的编码类型及其比例。以第一个P帧作为分

2021-06-23 14:20:10 316

原创 MPEG音频编码

一、MPEG-1 Audio LayerII编码器原理二、MPEG-1音频编码器框架多相滤波器组(Polyphase Filter Bank):将PCM样本变换到32个子带的频域信号如果输入的采样频率为48kHz,那么子带的频率宽度为48/(2*32)=0.75Hz缺点:等带宽的滤波器组与人类听觉系统的临界频带不对应◼ 在低频区域,单个子带会覆盖多个临界频带。在这种情况下,量化比特数不能兼每个临界频带滤波器组与临界频带比较:一个子带的频率响应:滤波器组与其逆过程不是无失真的◼ 但

2021-06-13 23:40:13 161

原创 JPEG原理分析及JPEG解码器的调试

一、实验目的掌握JPEG编解码系统的基本原理。初步掌握复杂的数据压缩算法实现,并能根据理论分析需要实现所对应数据的输出。二、实验原理1、JPEG编解码原理JPEG编码的过程如上图所示。解码是编码的逆过程。(1)零偏置(level offset)对于灰度级是 2n 的像素,通过减去 2n-1,将无符号的整数值变成有符号数;对于 n=8,即将 0~255 的值域,通过减去 128,转换为值域在-128~127 之间的值。这样做的目的是: 使像素的绝对值出现 3 位 10 进制的概率大大减少。(2

2021-06-06 18:34:16 124

原创 DPCM 压缩系统的实现和分析

一、实验目的掌握DPCM编解码系统的基本原理。初步掌握实验用C/C++/Python等语言编程实现DPCM编码器,并分析其压缩效率。二、DPCM编解码原理DPCM是差分预测编码调制的缩写,是比较典型的预测编码系统。在DPCM系统中,需要注意的是预测器的输入是已经解码以后的样本。之所以不用原始样本来做预测,是因为在解码端无法得到原始样本,只能得到存在误差的样本。因此,在DPCM编码器中实际内嵌了一个解码器,如编码器中虚线框中所示。在一个DPCM系统中,有两个因素需要设计:预测器和量化器。理想情况下,预

2021-04-30 18:28:36 170 1

原创 LZW 编解码算法实现与分析

一、实验目的掌握词典编码的基本原理,用C/C++/Python等语言编程实现LZW解码器并分析编解码算法。二、实验思想三、实验内容1.LZW编码原理及步骤LZW的编码思想是不断地从字符流中提取新的字符串,通俗地理解为新“词条”,然后用“代号”也就是码字表示这个“词条”。这样一来,对字符流的编码就变成了用码字去替换字符流,生成码字流,从而达到压缩数据的目的。LZW编码是围绕称为词典的转换表来完成的。LZW编码器通过管理这个词典完成输入与输出之间的转换。LZW编码器的输入是字符流,字符流可以是用8位

2021-04-08 21:10:54 551

原创 非结构化数据定义、处理方法及重要性

一、非结构化数据定义不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、 文本、图片、 标准通用标记语言下的子集 XML、 HTML、各类报表、图像和音频/视频信息等等。非结构化数据库是指其字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成的数据库,用它不仅可以处理结构化数据(如数字、符号等信息)而且更适合处理非结构化数据(全文文本、图象、声音、影视、超媒体等信息)。随着网络技术的发展,特别是Internet和Intranet技术的飞快发展,使得非结构化数

2021-04-07 17:39:52 3491

原创 BMP 序列转 YUV 文件

一、实验目的1.理解图像文件的基本组成。2.掌握结构体作为复杂数据对象的用法。进一步熟悉由问题到程序的解决方案,并掌握编程细节:如内存分配、倒序读写、字节序、文件读写过程等。二、实验原理1、BMP文件的组成结构BMP(全称 Bitmap)是 Windows 操作系统中的标准图像文件格式,可以分成两类:设备相关位图(DDB)和设备无关位图(DIB),使用广泛。它采用位映射存储格式,除了图像深度可选以外,在绝大多数应用中不采用其他任何压缩,因此,BMP 文件所占用的空间很大。BMP 文件的图像深度

2021-03-30 21:49:34 157

原创 TGA图像文件格式分析

什么是TGA?TGA(Targa)格式是计算机上应用最广泛的图象格式。在兼顾了BMP的图象质量的同时又兼顾了JPEG的体积优势 。并且还有自身的特点: 通道效果、方向性 。在CG领域常作为影视动画的序列输出格式,因为兼具体积小和效果清晰的特点。TGA的结构比较简单,属于图形、图像数据的通用格式,在多媒体领域有很大影响,是计算机生成图像向电视转换的一种首选格式 。TGA图像格式最大的特点是可以做出不规则形状的图形、图像文件,一般图形、图像文件都为四方形,若需要有圆形、菱形甚至是缕空的图像文件时,TGA就可

2021-03-24 17:16:40 1518

原创 RGB 和 YUV 彩色空间转换

一、实验目的1.学会从计算和程序的角度分析问题通过完成本实验,理解计算思维,即从问题出发,通过逐步分析和分解,把原问题转化为可用程序方式解决的问题。在此过程中设计出一个解决方案。2.进一步理解彩色空间的概念并掌握不同彩色空间转换的基本方程。3.通过逐步设计程序,掌握编程细节:如查找表的设计,内存分配,对 U 和 V 信号进行下采样,文件读写过程等。掌握程序调试的基本方法。二、实验原理1、YUV与RGB空间的相互转换由电视原理可知,亮度和色差信号的构成如下:Y=0.2990R+0.5870G+

2021-03-18 18:46:52 222

原创 对rgb和yuv分析三个通道的概率分布,并计算各自的熵

一、实验目的对rgb和yuv分析三个通道的概率分布,并计算各自的熵。(编程实现)二、注意事项①两个文件的分辨率均为256*256,②yuv为4:2:0采样空间③存储格式为:rgb文件按每个像素BGR分量依次存放;YUV格式按照全部像素的Y数据块、U数据块和V数据块依次存放。三、实现过程及结果1、rgb图像分析源程序:#include<stdio.h>#include#include<math.h>using namespace std;#define A

2021-03-09 15:05:40 129

原创 分析浊音、清音爆破音的时域及频域特性

分析浊音、清音爆破音的时域及频域特性本实验音频文件为手机录制,格式为m4a,将格式转化为wav后利用audacity进行分析由于语音信号具有短时平稳性,故本实验时域分析是在短时内的浊音:U时域特性:分析:①具有明显的短时周期性②短时过零率较小频谱分析:分析:①能量主要集中在低频区域②某些频率能量较高,具有共振峰特点清音:S时域特点:分析:①类似于白噪声②短时过零率较高,无明显周期性频域分析:分析:①能量集中在低频和高频区域②清音信号能量较小爆破音:P时域特

2021-03-08 12:50:17 656

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除