自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 数据压缩试验—H.264

一、码流H.264在视频编码层(VCL)和网络提取层(NAL)之间进行概念分割,以实现在不同的传输环境下的有效传输,便于与当前和将来的编码格式和不同类型的网络进行无缝连接。二、SPS(Sequence Parameter Set)是编码视频序列的全局参数,SPS里主要保存了一组编码视频序列(Coded Video Sequence)的全局参数。所谓的编码视频序列即原始视频的一帧一帧的像素数据经过编码之后的结构组成的序列。而每一帧的编码后数据所依赖的参数保存于图像参数集(PPS)中。一般情况SPS和PP

2021-07-08 21:40:48 192

原创 数据压缩试验六:MPEG音频编码

一、实验原理1、感知编码的基本思路(1)心理声学模型:听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号就听不到。听觉阈值的大小随声音频率的改变而改变。一个人是否听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值。听觉掩蔽特性:即听觉阈值电平是自适应的,会随听到的不同频率声音而发生变化。声音压缩算法可以确立这种特性的模型来取消更多的冗余数据。(2)人耳听觉特性人类听觉系统大致等效于一个在0Hz到20KHz频率范围内由25个重叠的带通滤波器组成的滤波器组。人耳不能区分

2021-06-20 14:58:20 284

原创 数据压缩试验五:JPEG解码

JPEG编码过程:YUV图片输入,依次经过零偏置、8x8DCT变换、统一量化,然后分为DC系数和AC系数分别进行编码。DC系数进行差分编码然后进行Huffman编码,AC系数先进行zigzag扫描然后进行游程编码然后进行Huffman编码生成码流。JPEG解码过程:解码Huffman数据,解码DC差值,重构量化后的系数,DCT逆变换,丢弃填充的行/列,反零偏置,对丢失的CbCr分量差值(下采样的逆过程)JPEG 在文件中以 Segment 的形式组织,它具有以下特点:1.均以 0xFF 开始,后

2021-06-20 14:42:57 198

原创 数据压缩作业三:非结构化数据

非结构化数据非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片、XML, HTML、各类报表、图像和音频/视频信息等等。非结构化数据包含了文本、图象、声音、影视、超媒体等典型信息,在互联网上的信息内容形式中占据了很大比例。随着“互联网+”战略的实施,将会有越来越多的非结构化数据产生,据预测,非结构化数据将占据所有各种数据的70-80%以上。结构化数据分析挖掘技术经过多年的发展,已经形成了相对比较成熟的技术体系。也正是由于非

2021-06-05 16:42:22 242

原创 数据压缩试验四:DPCM编码

一.实验目的掌握DPCM编解码系统的基本原理。初步掌握实验用C/C++/Python等语言编程实现DPCM编码器,并分析其压缩效率。二.实验内容DPCM是差分预测编码调制的缩写,是比较典型的预测编码系统。在DPCM系统中,需要注意的是预测器的输入是已经解码以后的样本。之所以不用原始样本来做预测,是因为在解码端无法得到原始样本,只能得到存在误差的样本。因此,在DPCM编码器中实际内嵌了一个解码器,如编码器中虚线框中所示。首先输入一个图像,与上一个图像的预测值做差,将差值进行编码。编码后的差值有两个去

2021-06-05 16:39:35 122

原创 数据压缩试验三:LZW编解码算法实现与分析

LZW编码原理思路LZW的编码思想是不断地从字符流中提取新的字符串,通俗地理解为新“词条”,然后用“代号”也就是码字表示这个“词条”。这样一来,对字符流的编码就变成了用码字去替换字符流,生成码字流,从而达到压缩数据的目的。LZW编码是围绕称为词典的转换表来完成的。LZW编码器通过管理这个词典完成输入与输出之间的转换。LZW编码器的输入是字符流,字符流可以是用8位ASCII字符组成的字符串,而输出是用n位(例如12位)表示的码字流。初始状态,字典里只有所有的默认项,例如0->a,1->b,2-

2021-06-05 16:14:08 430

原创 数据压缩实验二:图像文件的读写和转换(bmp转yuv)

实验目的:1.理解bmp文件的基本组成;2.实现bmp序列向yuv文件的转换(基本要求为24bit的bmp文件,进阶要求为支持小于24bit的bmp文件),并用YUV Viewer播放验证。BMP文件格式:典型的 BMP 图像文件由四部分组成:(1)位图头文件数据结构,它包含 BMP 图像文件的类型、显示内容等信息;位图文件头:typedef struct tagBITMAPFILEHEADER {WORD bfType; /* 说明文件的类型 /DWORD bfSize; / 说明文件的大

2021-05-27 16:06:14 87

原创 2021-05-27

一、TGA格式文件概述TGA格式图片文件(Tagged Graphics)是由美国Truevision公司为其显示卡开发的一种图像文件格式,文件后缀为".tga",已被国际上的图形、图像工业所接受。TGA的结构比较简单,属于一种图形、图像数据的通用格式,在多媒体领域有很大影响,是计算机生成图像向电视转换的一种首选格式。TGA图像格式最大的特点是可以做出不规则形状的图形、图像文件,一般图形、图像文件都为四方形,若需要有圆形、菱形甚至是缕空的图像文件时,TGA可就派上用场了! TGA格式支持压缩,使用不失真

2021-05-27 15:48:43 92

原创 2021-03-25

一、实验目的1.学会从计算和程序的角度分析问题通过完成本实验,理解计算思维,即从问题出发,通过逐步分析和分解,把原问题转化为可用程序方式解决的问题。在此过程中设计出一个解决方案。2.进一步理解彩色空间的概念并掌握不同彩色空间转换的基本方程。 3.通过逐步设计程序,掌握编程细节:如查找表的设计,内存分配,对 U 和 V 信号进行下采样,文件读写过程等。掌握程序调试的基本方法。二、知识储备1.彩色空间转换的基本思想及转换公式(1)YUV与RGB空间的相互转换由电视原理可知,亮度和色差信号的构成

2021-03-25 15:15:06 56

原创 作业:分析rgb文件和yuv文件的三个通道的概率分布并计算熵

#分析rgb文件和yuv文件的三个通道的概率分布并计算熵##题目分析1.rgb文件所占用的字节数为2562563;存储格式是{r0g0b0r1g1b1······}yuv文件所占用的字节数为2562561.5,存储格式是{y0y1y2···}{u0u1u2···}{v0v1v2···}采用8bit量化,共有256个灰度等级。##实验结果##实验总结rgb文件的熵均小于yuv文件的熵,yuv文件有更多压缩的空间,yuv文件的的压缩效果优于rgb文件。...

2021-03-10 00:02:29 99

原创 作业:自行录制轻音、浊音、爆破音并使用Audacity分析其时域和频域的特性

作业:自行录制轻音、浊音、爆破音并使用Audacity分析其时域和频域的特性## 录制轻音、浊音、爆破音浊音:发音时声带振动/z/轻音:发音时声带不动/s/爆破音:发音器官在口腔中形成阻碍,然后气流冲破阻碍而发出的声音/p/时域分析波形对比:依次为浊音、轻音、爆破音在这里插入图片描述由波形观察到:(1)浊音的平均幅度最大,轻音次之,爆破音最小。(2)浊音的幅度变化大,轻音的幅度变化小,爆破音的幅度快速减小到0.(3)轻音的短时过零率最大,爆破音次之,浊音最小。频域分析频谱对比:

2021-03-08 21:18:40 272

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除