自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 实验七 H.264编码实验

一、实验要求 自行选择或老师给的两个264文件进行解码,得到相应的YUV文件 将上述两个视频序列编码为.264文件 1、固定码率,以不同的GOP长度及形状编码 ■GOP=15,2B帧; GOP=12,2B帧, GOP=9,2B帧 ■GOP=4, 1B帧; GOP=12,无B帧; GOP=1,全I帧 2、相同的GOP长度及形状,不同的码率 例:1000kb/s, 800kb/s,400kb/s。 用码流分析软件检查所生成的码流中各种编码模式和运动矢量等信息 用播放器观看所生成码流的质量 生成率失真曲线 二、实

2021-07-09 18:42:22 141

原创 实验六 MPEG音频编码

一、MPEG音频编码原理 1.1 基本思想 分析信号,去掉不能被感知的部分【声音压缩算法可以确立这种特性的模型来取消更多的冗余数据】 子带分析滤波器组:使信号具有高的时间分辨率【短暂冲击信号情况下,编码的声音信号具有足够高的质量】 FFT运算:使信号具有高的频率分辨率 比特分配:低频子带分配较多的位数【保护音调和共振峰的结构】;高频自带分配较少的位数【摩擦音和类似噪声的声音】 1.2 心理声学模型(Psychoacoustic model) 生理(Physiological)感知极限(传感极限) 心

2021-06-13 12:09:48 191

原创 实验五 JPEG解码

一丶实验原理 1.JPEG简介: JPEG是Joint PhotographicExperts Group(联合图像专家小组)的缩写,是第一个国际图像压缩标准。JPEG图像压缩算法能够在提供良好的压缩性能的同时,具有比较好的重建质量,被广泛应用于图像、视频处理领域。 根据人眼的视觉特性,人眼对亮度信息比色度信息敏感,对低频信息比高频信息敏感。首先对色度信息进行下采样。另外,将空间域的亮度色度信息经DCT变换到频域,对亮度信息细量化、色彩信息粗量化,对低频信息细量化、高频信息粗量化。再对量化结果进行变长编码,

2021-06-03 16:39:34 210

原创 实验四 DPCM压缩系统的实现与分析

实验内容:将预测误差图像写入文件并将该文件输入Huffman编码器,得到输出码流、给出概率分布图并计算压缩比。 最后比较两种系统(1.DPCM+熵编码和2.仅进行熵编码)之间的编码效率(压缩比和图像质量)。压缩质量以PSNR进行计算。 DPCM编码原理 关键代码 DPCM()函数 void DPCM(unsigned char* YOrigi, unsigned char* YError, unsigned char* YRestr, int height, int width, int bits) {

2021-05-31 14:00:54 109

原创 实验三 LZW 编解码算法实现与分析

一、实验原理 1、LZW编码原理 2、LZW解码原理 在开始译码时词典包含所有可能的前缀根; 令CW=码字流中的第一个码字; 输出当前缀-符串string.CW到码字流; 先前码字PW=当前码字CW; 当前码字CW=码字流的下一个码字; 判断当前缀-符串string.CW 是否在词典中; (1)是——把当前缀-符串string.CW输出到字符流: 当前前缀P=先前缀-符串string.PW; 当前字符C=当前前缀-符串string.CW的第一个字符; 把缀-符串P+C添加到词典; (2)否——当前前缀P=

2021-04-22 23:48:33 287

原创 实验二 图像文件的读写和转换

1、主函数 #include <stdio.h> #include <windows.h> #include "bmp2yuv.h" void main(int argc, char *argv[]) { FILE *bmpFile = NULL, *yuvFile = NULL; BITMAPFILEHEADER File_header; BITMAPINFOHEADER Info_header; char* bmpFileName=NULL; char* yuvFi

2021-04-09 17:10:24 211

原创 作业2 分析TGA文件

一、TGA文件格式解析 二、文件格式 文件头(Tga File Header):由图像描述信息字段长度、颜色表类型、图像类型、颜色表说明和图像说明五个字段组成,总计18字节,描述了图像存储的基本信息,应用程序可依据该部分字段值读写图像数据。 图像/颜色表数据(Image/Color Map Data):由图像描述信息(可选)、颜色表数据和图像数据三部分组成,用于存储图片的图像信息。 开发者自定义区域(Developer Area):包含开发者定义字段列表和开发者字典(用于存储开发者定义字段的值),该区域为

2021-03-25 15:41:27 182

原创 实验一 彩色空间转换

一、实验目的 YUV与RGB空间的转换 二、实验原理 (1)YUV与RGB空间的相互转换由电视原理可知,亮度和色差信号的构成如下: Y=0.2990R+0.5870G+0.1140B R-Y=0.7010R-0.5870G-0.1140B B-Y=-0.2990R-0.5870G+0.8860B 为了使色差信号的动态范围控制在0.5之间,需要进行归一化,对色差信号引入压缩系数。归一化后的色差信号为: U=-0.1684R-0.3316G+0.5B V=0.5R-0.4187G-0.0813B (2) 码电平

2021-03-20 01:05:20 180

原创 分析三个通道的概率分布,并计算各自的熵

由信息论与编码我们能知道计算熵的公式 一、分析rgb文件及计算熵 1、代码 #include<iostream> #include<math.h> using namespace std; #define down 256*256 int main() { unsigned char R[down] = { 0 }, G[down] = { 0 }, B[down] = { 0 }; //R、G、B double R1[256] = { 0 }, G1[256

2021-03-11 01:24:41 380

原创 使用audacity分析清音、浊音、爆破音的时域及频域特性

一、时域分析 1、清音t 2、浊音u 3、爆破音po 二、频域分析 1、清音t 2、浊音u 3、爆破音po 三、分析 1、清音 时域波形无规律。 频域波形可以看出能量分布较均匀,从低频到高频都有能量分布。 2、浊音 时域波形有一定的规律性。 频域波形能量集中在低频区,大概300hz到1000hz处最为集中。 3、爆破音 时域波形逐渐衰减。 频域波形集中在低频区,高频区无能量分布。 ...

2021-03-10 19:34:58 292

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除