自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 H.264编码实验

一、实验要求二、实验过程首先输入一个“highway_qcif.yuv”的序列视频,该视频的特点是一直在行驶的车辆拍摄的公路的画面,画面内容变化不大,不同码率、不同GOP下编出的亮度峰值信噪比如下所示:画出该序列的率失真曲线图下面这个序列是“demo.yuv”的编码,这个视频的特点是只有一个小孩子在背景不动的情况下,做摆幅不大的变动。不同码率、不同GOP下编出的亮度峰值信噪比如下图所示:画出该视频序列的率失真曲线如下三、实验结果1、固定码率,B帧的数量,在率失真曲线上面纵向对比GOP15

2021-07-05 19:30:42 125

原创 H.264码流解析

一、实验要求1、选择一个.mp4或者.264文件。2、在码流分析仪软件中打开该文件,从几个层次进行分析:分析SPS和PPS里都包含哪些主要的信息,给出参数值。(例如分辨率、帧率、GOP结构等等)以一个GOP为例,分析如下信息:每个图像帧的类型及所用的编码比特数、QP值;并以图像帧号为横坐标、每帧所用比特数为纵坐标画出曲线图;以图像帧号为横坐标、每帧所用QP为纵坐标画出曲线图。以第一个I帧作为分析对象,基于该帧图像的空间特性,分析每个宏块所采用的编码类型及其比例。以第一个P帧作为分析对象,基于该

2021-07-05 17:24:59 113

原创 补充:BMP序列转YUV

实验目的:1.理解bmp文件的基本组成;2.实现bmp序列向yuv文件的转换(基本要求为24bit的bmp文件,进阶要求为支持小于24bit的bmp文件),并用YUV Viewer播放验证。BMP文件格式:典型的 BMP 图像文件由四部分组成:(1)位图头文件数据结构,它包含 BMP 图像文件的类型、显示内容等信息;位图文件头:typedef struct tagBITMAPFILEHEADER {WORD bfType; /* 说明文件的类型 /DWORD bfSize; / 说明文件的大

2021-07-04 19:02:12 85

原创 MPEG音频编码

一、JPEG编码原理1)颜色空间转换RGB2YUV2)零电平偏置 DC电平偏移的目的是保证输入图像的采样有近似地集中在零附近的动态范围。DC电平偏移执行的图像采样只通过无符号数表示。3)DCT变换 DCT(DiscreteCosineTransform)是将图像信号在频率域上进行变换,分离出高频和低频信息的处理过程。然后再对图像的高频部分(即图像细节)进行压缩,以实现能量集中和去相关,便于去除空间冗余,以达到压缩图像数据的目的。首先将图像划分为多个8*8的矩阵【如果图像的宽和高不是

2021-07-03 14:19:43 274

原创 JPEG解码器

JPEG编码原理JPEG文件格式1)SOI:FFD8,图像开始标志2)APP0:FFE0,应用程序保留标记3)DQT:FFDB, 量化表4) SOF0:FFC0, 帧图像开始5)DHT Haffman表6)SOS:FFDA, 扫描开始三个重要结构体huffman表结构体struct huffman_table{ /* Fast look up table, using HUFFMAN_HASH_NBITS bits we can have directly the symbol

2021-06-10 16:55:43 149

原创 DPCM编码进行图像压缩

一、实验要求本实验的目标是验证DPCM编码的编码效率。首先读取一个256级的灰度图像,采用自己设定的预测方法计算预测误差(本次实验报告使用左向预测),并对预测误差进行8比特均匀量化(基本要求)。还可对预测误差进行1比特、2比特和4比特的量化设计(提高要求)。在DPCM编码器实现的过程中可同时输出预测误差图像和重建图像。将预测误差图像写入文件并将该文件输入Huffman编码器,得到输出码流、给出概率分布图并计算压缩比。将原始图像文件输入Huffman编码器,得到输出码流、给出概率分布图并计算压缩比。最后比

2021-06-03 16:44:09 318

原创 LZW编码

一.实验目的掌握词典编码的基本原理,用C/C++/Python等语言编程实现LZW解码器并分析编解码算法。二.实验原理编码原理解码原理代码实现LZW.C/* * Definition for LZW coding * * vim: ts=4 sw=4 cindent nowrap */#include <stdlib.h>#include <stdio.h>#include "bitio.h"#define MAX_CODE 65535struct

2021-05-27 16:30:18 60

原创 TAG格式文件转YUV格式文件

一.实验要求了解TGA文件的存储格式,将TGA格式文件转换为YUV格式。二.实验过程1.程序的设计思路是:1、先建立一个TGA文件的头文件结构体,用于读取头文件数据。2、从头文件中获得图片长宽数据,因为只支持类型为2的文件,在无调色板无图像信息的情况下,数据的偏移量固定为18。3、定好偏移量后,因为TGA文件的数据是从左下角读入,也就是图片的上下是颠倒的,读取RGB数据时需要将图片正向读入。4、之前写过RGB2YUV的程序,因此在读入RGB数据后,可以直接调用转化为YUV图像。2.实验代码

2021-05-27 15:55:32 182

原创 TAG图片分析

1 TGA格式简介TGA是由美国Truevision公司为其显示卡开发的一种图像文件格式,已被国际上的图形、图像工业所接受。现已成为数字化图像,以及运用光线跟踪算法所产生的高质量图像的常用格式。TGA(Targa)格式是计算机上应用最广泛的图像格式。在兼顾了BMP的图像质量的同时又兼顾了JPEG的体积优势。并且还有自身的特点:通道效果、方向性。在CG领域常作为影视动画的序列输出格式,因为兼具体积小和效果清晰的特点。TGA格式支持压缩,使用不失真的压缩算法。2 TGA文件结构及实例分析TGA原始文件

2021-03-25 15:56:56 1477

原创 RGB文件与YUV文件相互转化

YUV与RGB彩色空间转换公式Y = 0.299R + 0.587G + 0.114B;U = -0.169R - 0.331G + 0.5B ;V = 0.5R - 0.419G - 0.081B;R = Y + 1.4075V;G = Y - 0.3455U - 0.7169V;B = Y + 1.779U;基本算法该程序算法分为下面几个模块:1、预备阶段:rgb文件导入项目、打开rgb文件,创建要进行输出的yuv文件和新的rgb文件、开辟空间。2、提取rgb文件中的r、g、b分量

2021-03-24 10:33:55 137

原创 使用音频分析软件分析轻音、浊音、爆破音的时域和频域特性

一、时域分析1.轻音t2.浊音u3.爆破音b二、频域分析1.轻音t2.浊音u3.爆破音b三、分析1.轻音频域波形分布各个频率都有2.浊音能量在低频区域较为集中3.爆破音时域波形分布集中频域波形基本都在低频区...

2021-03-11 08:37:48 239

原创 rgb和yuv文件三个通道的概率分布和各自的熵

要求:对down.rgb和down.yuv分析三个通道的概率分布,并计算各自的熵。(编程实现)两个文件的分辨率均为256*256,yuv为4:2:0采样空间,存储格式为:rgb文件按每个像素BGR分量依次存放;YUV格式按照全部像素的Y数据块、U数据块和V数据块依次存放。*down.rgb#include<stdio.h>#include<iostream>#include<math.h>using namespace std;#define A 6553

2021-03-10 22:30:34 193

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除