自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 实验7h.264编码

SPS比特流所遵循的配置和级别:66遵守A2.1/A2.2,可以不遵循A2.3,1b解码图像宽度54(宏块),高度30(宏块)帧率:time_scale/num_units=60mbs_only_flag=1,仅包含宏块direct_8x8_inference_flag 表示在 8.4.1.2 节中规定的 B_Skip、B_Direct_16x16 和 B_Direct_8x8 亮度运动矢量的计算过程使用的方法。当 frame_mbs_only_flag 等于 0 时 direct_8x8_

2021-06-17 17:20:03 140

原创 实验六——MPEG2音频编码实验

感知音频编码的设计思想由于人耳对于某些频率段的声音听觉效果不明显,则对于此部分音频可以不编码。频域掩蔽效应心理声学模型码率分配的实现思路噪掩比等于信掩比减去信噪比,最好降低噪掩比到0。对最高NMR的子带分配比特,使获益最大的子带的量化级别增加一级。重新计算分配了更多比特子带的NMR。循环上述步骤,直到所有NMR都降到0或者没有比特可供分配。main函数代码解读 frame_info frame;//结构体包含头信息、比特分配表、声道数、子带数等内容 frame_header hea

2021-06-17 00:04:52 237

原创 实验5 JPEG原理与编解码实现

JPEG 概述JPEG 是 Joint Photographic Experts Group 的缩写,即 ISO 和 IEC 联合图像专家组,负责静态图像压缩标准的制定,这个专家组开发的算法就被称为 JPEG 算法,并且已经成为了大家通用的标准,即 JPEG 标准。 JPEG 压缩是有损压缩,但这个损失的部分是人的视觉不容易察觉到的部分,它充分利用了人眼对计算机色彩中的高频信息部分不敏感的特点,来大大节省了需要处理的数据信息。总体来说,一个原始图像信息,要对其进行 JPEG 编码,过程分两大步:1、

2021-06-10 12:05:26 448

原创 Lloyd标量量化器条件推导与DPCM预测系数推导

2021-05-13 12:02:13 173

原创 DPCM编码算法实现

1 压缩效果的分析1.1 压缩效率的对比根据 压缩比 = 原图大小 : 压缩码流大小huffman编码1.41:1,DPCM&huffman编码2.25:1DPCM对原始图像经过预测编码以后,对数据的压缩比提升是非常大的1.2 DPCM压缩后的数据分布1.3 DPCM编码后各图像效果1.4 压缩质量2代码2.1 1/2/4 比特的量化设计4bitunsigned char quantify(int dn) { dn >>= 5;//范围-16-16 dn +=

2021-05-09 23:18:09 833

原创 实验三----LZW 编解码算法实现与分析

1 实验目的掌握词典编码的基本原理,用C/C++/Python等语言编程实现LZW解码器并分析编解码算法。2 实验原理2.1 LZW编码原理1、初始字典包含所有的单字符,初始化P=NULL;2、将数据流的下一个字符赋给C;3、判断P+C(P连接C)这个字符是否在字典里:(1)是——P=P+C;(2)否——输出P对应的码字CW,将P+C作为新串写入字典,P=C;4、返回步骤2。2.2 LZW解码原理1、在开始译码时词典包含所有可能的前缀根;2、令CW=码字流中的第一个码字;3、输出当

2021-04-22 21:00:54 132

原创 数据压缩实验2——bmp图像文件的读写和转换

1 实验目的理解bmp文件的基本组成;实现bmp序列向yuv文件的转换(基本要求为24bit的bmp文件,进阶要求为支持小于24bit的bmp文件),并用YUV Viewer播放验证。2 bmp文件格式bmp文件大体上分为4个部分:位图文件头BITMAPFILEHEADER位图信息头BITMAPINFOHEADER调色板Palette实际的位图数据ImageData2.1 位图文件头BITMAPFILEHEADER2.2 位图信息头BITMAPINFOHEADER2.3 调色板Pa

2021-04-07 17:41:15 266

原创 数据压缩作业2——TGA格式文件分析

TGA文件格式:1.TGA文件头——TGA FILE HEADER 18Btyes2.图像颜色表数据——IMAGE/COLOR MAP DATA3.开发者区域——DEVEOPER AREA4.拓展区域——EXTENSION AREA5.TGA文件注脚——TGA FILE FOOTER 26Bytes分析用图片:第一字节:00第二字节:00第三字节:02 未压缩真彩图像第四、五字节:00 00 装载颜色表的首地址第六、七字节:00 00 颜色表表项的数量第八字节:00 每个表

2021-03-26 17:17:44 112

原创 实验报告1RGB与YUV格式相互转换原理及实现

(1)根据电视原理的知识,可知RGB转化为YUV的公式为:Y = 0.2990R+ 0.5870G+0.1140BU = -0.1684R-0.3316G+0.5B+128V= 0.5R-0.4187G-0.0813B+128(2)使用4:2:0的采样格式,U、V的值需要每2X2取一个平均值;转化过程编写成一个函数:#include "stdlib.h"#include "rgb2yuv.h"static float RGBYUV02990[256], RGBYUV05870[256],

2021-03-17 13:46:02 313

原创 分析RGB/YUV三个通道的概率分布,并计算各自的熵。

实验目的:对down.rgb和down.yuv文件分别分析RGB三个通道的概率分布,并计算各自的熵。已知:图片大小256*256rgb文件存储格式BGRBGR……yuv文件以4:2:0采样,按照全部像素的Y数据块、U数据块和V数据块依次存放。实验思路:1.图片大小为256256,每个像素包含BGR三个分量,一共有256256*3个值存入buffer数组中。2.从buffer数组中分别统计B、G、R的值放入B、G、R三个数组。3.8bit量化共有256个值,统计B、G、R的概率分布。4.从

2021-03-08 00:34:58 322

原创 用Audacity分析清音、浊音、爆破音的时域频域特性

用Audacity分析清音、浊音、爆破音的时域频域特性清音s:时域信号的短时平均幅度较低,短时过零率较高,类似于高斯白噪声。频域信号能量较多出现在高频区。浊音b:时域信号的短时平均幅度较大,短时过零率较低,且具有周期性。频域信号的能量主要集中在3khz以下。爆破音p:时域信号短时过零率较高,呈现随机性。频域信号能量在1000Hz处出现峰值 。...

2021-03-06 19:48:25 195

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除