自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 H.264文件解析

文章目录一、选择.264文件分析SPS、PPSSPSPPS二、以GOP为单位分析该文件第一帧为I帧:该视频第二帧为P帧参考资料一、选择.264文件分析SPS、PPSSPS通过读SPS信息得出文件大小为864*480pixel,bit数:33741bytes,码率:18bps,Video Format : YUV420PPS二、以GOP为单位分析该文件第一帧为I帧:空间特性I帧均采用帧内编码,由于没有前参考帧,所以未使用到运动矢量。该帧每个宏块所用的平均编码比特数为166.599

2021-07-02 16:24:16 198

原创 MPEG-1音频编解码

文章目录一、人耳听觉系统的感知特性1.听觉阈值2.频域掩蔽效应3.临界频带4.人耳听觉系统5.时域掩蔽效应二、MPEG1音频压缩编码1.多相滤波器组2.心理声学模型3.比特分配,量化编码三、 MPEG-1 Audio Layer II编码器调试1.输出音频的采样率和目标码率2.输出某个数据帧的比特数、比例因子、比特分配结果一、人耳听觉系统的感知特性1.听觉阈值人耳能察觉到的声音为20-20KHZ,对3-4KHZ的声音感觉最灵敏,在最小可听域下方的声音可不编码。2.频域掩蔽效应一个高强度纯音可以

2021-06-16 23:47:17 666

原创 实验五——JPEG原理分析及JPEG解码器的调试

系列文章目录提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、pandas是什么?二、使用步骤1.trace2.huffman码表总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文

2021-06-09 23:46:48 254 2

原创 作业-随机信号的参数建模法

一、概述在随机信号的参数模型中,我们认为随机信号x(n)是由白噪声w(n)激励某一确定系统的响应,只要w(n)的参数确定了,研究随机信号就可以转化成研究产生随机信号的系统。对于平稳随机信号,主要有三种常用的线性模型:AR(Auto-Regression,自回归)模型、MA(Moving Average,滑动平均)模型和ARMA(Auto-Regression-Moving Average,自回归滑动平均)模型。1、MA模型随机信号x(n)由当前的激励w(n)和若干次过去的激励w(n−k)线性组合产

2021-06-02 13:33:51 427

原创 数据压缩实验四——DPCM压缩系统的实现和分析

文章目录一、实验原理二、实验步骤1.读入2.DPCM3.计算概率3.计算PSNR三、实验结果一、实验原理DPCM是差分预测编码调制的缩写,本次实验采用固定预测器和均匀量化器,预测器采用前向预测。其中xn为输入信号,Q为量化器,dn=pn+xn为预测误差,P为延时器。大致算法步骤如下:读取一个256级的灰度图像,与前一个像素作差得到预测误差,范围为[-255,255]。需要将其范围转变为计算机可以表示的范围,先转变为单极性,即加上255,范围变为[0,510]。进行8bit均匀量化。二、实验

2021-05-01 13:09:48 119

原创 数据压缩实验三——LZW编解码思想及分析

LZW编码思想步骤1:将词典初始化为包含所有可能的单字符,当前前缀P初始化为空。步骤2:当前字符C=字符流中的下一个字符。步骤3:判断P+C是否在词典中(1)如果“是”,则用C扩展P,即让P=P+C,返回到步骤2。(2)如果“否”,则输出与当前前缀P相对应的码字W;将P+C添加到词典中;令P=C,并返回到步骤2举例编码abcbcabcabcd,初始dictionary为symboldecimala1b2c3d4steppc

2021-04-21 22:55:04 195

原创 数据压缩实验二——bmp转yuv文件

bmp文件格式转换为yuv文件格式文章目录bmp文件格式转换为yuv文件格式一、bmp格式介绍二、实验步骤1.生成bmp文件2.开辟缓冲区读入bmp文件,用结构体File_header盛放文件头数据,用结构体Info_header盛放信息头数据3.调用bmp2rgb函数4.调用rgb2yuv函数5.实验结果三、实验总结一、bmp格式介绍位图图像(全称:bitmap), 亦称为点阵图像,区别于矢量图放大不失真的特征,位图图像是由单个像素点组成,放大后会失真。它是 Windows操作系统中的标准系统中

2021-04-08 00:08:25 163

原创 数据压缩作业二——分析tga文件

数据压缩作业二——分析tga文件文章目录数据压缩作业二——分析tga文件TGA格式文件二、使用二进制编辑软件分析tga文件1.TGA文件头(TGA FILE HEADER)2.读入数据总结TGA格式文件TGA是由美国Truevision公司为其显示卡开发的一种图像文件格式,已被国际上的图形、图像工业所接受。现已成为数字化图像,以及运用光线跟踪算法所产生的高质量图像的常用格式。TGA文件的扩展名为.tga,该格式支持压缩,使用不失真的压缩算法,可以带通道图,另外还支持行程编码压缩。新的TGA文件包

2021-03-25 00:36:29 226

原创 数据压缩试验2——YUV2RGB格式转换

数据压缩试验2——YUV2RGB格式转换文章目录数据压缩试验2——YUV2RGB格式转换一、实验要求二、实验原理三、实验过程四、实验结果五、总结一、实验要求1.参考rgb2yuv实验代码;2. 自行编写yuv2rgb代码,实现yuv文件到rgb文件的转换;3.与原来的rgb文件比较。二、实验原理1.根据rgb到yuv的转换公式:Y=0.2990R+0.5870G+0.1140BU = − 0.1684 R − 0.3316 G + 0.5 B + 128V = 0.5 R − 0.4

2021-03-24 17:03:53 346

原创 对RGB和YUV文件各通道进行概率密度分析,并计算信息熵

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录一、作业题目二、解决思路1. 具体实现2.结果三、总结归纳一、作业题目对down.rgb和down.yuv文件分析,分辨率均为256*256,YUV为4:2:0,rgb文件按照每个像素BGR分量依次存放,YUV按照全部像素的Y数据块、U数据块、V数据块依次存放。二、解决思路将RGB/YUV数据计入到一个数组中,读取各个分量频数,除以256*256得到频率,根据熵的公式计算出信息熵。1. 具体实现代码如下:#inc

2021-03-08 22:51:54 119

原创 使用Audacity软件分析浊音、清音、爆破音的时域及频域特性。

使用Audacity软件分析浊音、清音爆破音的时域及频域特性。作业步骤时域分析频域分析1.时域分析(1).浊音【a】的时域波形(2)清音【s】的时域波形(3)爆破音【k】的时域波形结果分析:浊音的平均幅度最大,爆破音最小,清音居中。浊音的时域波形具有比较明显的周期性,清音和爆破音没有表现出明显的周期性。2.频域分析(1)浊音【a】的频谱(2)清音【s】的频谱(3)爆破音【k】的频谱结果分析:浊音的低频能量较大,清音高频能量较大,爆破音则是集中在中频。浊音有明

2021-03-07 21:09:22 255

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除