自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 实验八 H.264编码实验

一、SPS与PPS主要信息1.序列参数集SPS(Sequence parameter set): 说明的是某一段视频序列的编码特性。profile_idc,level_idc两个语法元素说明该段视频序列遵循的是H.264/AVC标准的哪一种配置,以指导解码端调用合适的解码器进行解码。pic_order_cnt_type等语法元素说明该段视频序列中每帧图像的记数方法,pic_ widthes_in_mbs_minus1和pic_ height_in_map_units_minus1这两个语法元素说明该段视频

2021-07-08 16:49:07 209

原创 实验六 MPEG音频实验

一、实验原理音频压缩编码的本质是感知编码,利用感知模型去除不敏感的声音数据,同时保证声音质量不会有明显下降。它采用子带编码技术,根据心理声学模型获得不同子带的听觉掩蔽阈值,并对每个子带的取样值进行动态量化。1.感知音频编码的设计思想1)人耳听觉特性临界频带人类听觉系统大致等效于一个在0Hz到20KHz频率范围内由25个重叠的带通滤波器组成的滤波器组,这25个频带被称为临界频带,人耳不能区分同一频带内同时发生的不同声音。掩蔽效应一个较弱的声音的听觉感受被另一个较强的声音影响的现象称为人耳的听觉掩

2021-06-16 17:57:03 292

原创 实验五 JPEG原理分析及JPEG解码器的调试

一、实验目的掌握JPEG编解码系统的基本原理。初步掌握复杂的数据压缩算法实现,并能根据理论分析需要实现所对应数据的输出。二、实验原理(一)JPGE文件格式:1.文件格式:SOI:Start of Image 图像开始;APP0:Application 应用程序保留标记0;DQT:Define Quantization Table 定义量化表;SOF0:Start of Frame 帧图像开始;DHT:Define Huffman Table 定义哈夫曼表;SOS:Start of Sca

2021-06-09 21:08:20 162

原创 作业:随机信号的参数建模法及MATLAB实现

随机信号AR模型及MATLAB实现随机信号的参数建模法在对语音信号进行编码时,往往通过分析不同种类语音信号的特点及产生,用数学模型表示信源,而编码器根据输入信号计算模型参数,然后对模型参数进行编码,也就是说,只需要对编码后的参数进行传送(而不需要传送语音信号本身),解码器通过收到的模型参数,直接利用相同的数学模型即可重建出语音信号,大大减小了传送的数据量.随机信号x ( n )是由白噪声w ( n ) 激励某一确定系统的响应,只要w ( n ) 的参数确定了,研究随机信号就可以转化成研究产生随机信号

2021-06-02 17:42:10 521

原创 实验四 DPCM压缩系统的实现和分析

DPCM编码原理:DPCM是差分预测编码调制的缩写,是比较典型的预测编码系统。在DPCM系统中,需要注意的是预测器的输入是已经解码以后的样本。之所以不用原始样本来做预测,是因为在解码端无法得到原始样本,只能得到存在误差的样本。因此,在DPCM编码器中实际内嵌了一个解码器,如编码器中虚线框中所示。为防止量化误差累积,采用上一个样点的重建值对当前样点进行预测,故编码器中应内嵌一个解码器(如虚线所示),需要在编码端获得解码重建值。在一个DPCM系统中,有两个因素需要设计:预测器和量化器。理想情况下,预测器

2021-05-06 19:39:03 107

原创 实验三 LZW编码解码算法实现与分析

一、LZW编码解码的原理1.编码原理LZW的编码思想是不断地从字符流中提取新的字符串,通俗地理解为新“词条”,然后用“代号”也就是码字表示这个“词条”。这样一来,对字符流的编码就变成了用码字去替换字符流,生成码字流,从而达到压缩数据的目的。LZW编码是围绕称为词典的转换表来完成的。LZW编码器通过管理这个词典完成输入与输出之间的转换。LZW编码器的输入是字符流,字符流可以是用8位ASCII字符组成的字符串,而输出是用n位(例如12位)表示的码字流。LZW编码算法的步骤如下:步骤1:将词典初始化为包含所

2021-04-19 20:47:48 271

原创 实验二 BMP序列转YUV文件

1.基本原理BMP文件的组成结构BMP(全称 Bitmap)是 Windows 操作系统中的标准图像文件格式,可以分成两类:设备相关位图(DDB)和设备无关位图(DIB),使用广泛。它采用位映射存储格式,除了图像深度可选以外,在绝大多数应用中不采用其他任何压缩,因此,BMP 文件所占用的空间很大。BMP 文件的图像深度可选 lbit、4bit、8bit、16bit 及24bit。BMP 文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。由于 BMP 文件格式是 Windows 环境中交换与图有

2021-04-06 19:15:24 69

原创 作业2 TGA文件分析

TGA格式TGA是由美国Truevision公司为其显示卡开发的一种图像文件格式,已被国际上的图形、图像工业所接受。现已成为数字化图像,以及运用光线跟踪算法所产生的高质量图像的常用格式。TGA文件的扩展名为.tga,该格式支持压缩,使用不失真的压缩算法,可以带通道图,另外还支持行程编码压缩。TGA的结构比较简单,属于一种图形、图像数据的通用格式,在多媒体领域有很大影响,是计算机生成图像向电视转换的一种首选格式。TGA格式支持压缩,使用不失真的压缩算法。FlexHEXFlexHEX是功能齐全的十六进

2021-03-23 19:35:35 131

原创 实验一 彩色空间转换

一、实验目的1.从计算和程序的角度分析问题。2.进一步理解彩色空间的概念并掌握不同彩色空间转换的基本方程。3.通过逐步设计程序,掌握编程细节:如查找表的设计,内存分配,对U和V信号进行下采样,文件读写过程等。掌握城促调试基本方法。二、实验基础彩色空间转换的基本思想及相互转换YUV和RGB空间的相互转换Y=0.2990R+0.5870G+0.1140BR-Y=0.7010R-0.5870G-0.1140BB-Y=-0.2990R-0.5870G+0.8860B为了使色差信号的动态范围控制

2021-03-22 16:58:38 136

原创 YUV、RGB通道熵计算

分析RGB通道熵:说明:两个文件的分辨率均为256*256,yuv为4:2:0采样空间,采用8bit量化。思路:将文件导入,统计各像素点的概率并放入buffer中存储,再利用求熵的公式进行计算。#include <iostream>#include <math.h>using namespace std;int main(){ FILE* file1, * file2; unsigned char* buffer0 = new unsigned char[256

2021-03-08 11:16:54 171 1

原创 浊音/清音/爆破音的时域及频域特性

第一周作业浊音/清音/爆破音的时域及频域特性思路:使用Audacity进行录制,时域部分将音频放大观察波形规律,频域部分生成并进行频谱分析。(1)浊音U时域分析:时域表现为短周期性,波形比较规律。频域分析:频域上表现为频率集中在低频区域,共振峰较为明显,短时能量较高。(2)清音S时域分析:时域波形没有周期性,整体振幅小于浊音。频域分析:频域波形平缓,无共振峰,能量比较集中。(3)爆破音t时域分析:脉冲波,更为尖锐,整体上振幅降低。频域分析:没有像浊音一样的共振

2021-03-07 17:47:12 972

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除