自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 H.264文件分析

H.264文件分析

2021-07-13 22:20:52 56

原创 MPEG音频编码实验

MPEG音频编码实验一、实验要求◼ 理解程序设计的整体框架◼ 理解感知音频编码的设计思想两条线时-频分析的矛盾!◼ 理解心理声学模型的实现过程临界频带的概念掩蔽值计算的思路◼ 理解码率分配的实现思路◼ 输出音频的采样率和目标码率◼ 选择三个不同特性的音频文件噪声(持续噪声、突发噪声)音乐混合◼ 某个数据帧,输出该帧所分配的比特数该帧的比例因子该帧的比特分配结果二、实验内容1.程序设计的整体框架主函数 注释int main (int argc,

2021-06-17 09:56:59 86

原创 JPEG原理分析及JPEG解码器的调试

JPEG原理分析及JPEG解码器的调试一、实验要求1.逐步调试JPEG解码器程序。将输入的JPG文件进行解码,将输出文件保存为可供YUVViewer观看的YUV文件; 理解程序设计的整体框架;理解三个结构体的设计目的:• struct huffman_table• struct component• struct jdec_private理解在视音频编解码调试中TRACE的目的和含义:• 会打开和关闭TRACE• 会根据自己的要求修改TRACE2.以txt文件输出所有的量化矩

2021-06-09 19:52:57 115

原创 随机信号AR模型

随机信号AR模型一、随机信号的参数建模法为随机信号建立参数模型是研究随机信号的一种基本方法,其含义是认为随机信号 x(n)是由白噪 ω(n)\omega(n)ω(n) 激励某一确定系统的响应。只要白噪的参数确定了,研究随机信号就可以转化成研究产生随机信号的系统.信号的现代建模方法(Modern modeling method for signal)是建立在具有最大的不确定性基础上的预测。提出了众多的数学模型( mathematical models)。根据 Wold 的证明:任何平稳的 ARMA(自

2021-06-03 22:33:54 606

原创 DPCM 压缩系统的实现和分析

DPCM 压缩系统的实现和分析一、实验要求掌握DPCM编解码系统的基本原理。初步掌握实验用C/C++/Python等语言编程实现DPCM编码器,并分析其压缩效率。二、算法原理1.DPCM编解码原理xn为输入,pn为xn的预测值,两者进行差分得到dn,经过量化器Q得到量化后的dn,然后与预测值形成了一个解码器得到量化后的xn,量化后的xn经过编码成为下一个xn+1的预测值。2. PSNRPeak Signal to Noise Ratio用于衡量压缩质量,计算公式为其中L-1表示可能出现的

2021-05-06 13:59:50 61

原创 LZW 编解码算法实现与分析

LZW 编解码算法实现与分析一、实验要求调试LZW编码和解码程序,理解算法和代码,并对10个不同类型的文件进行压缩测试,分析压缩效率。二、算法原理1.编码流程图:#mermaid-svg-nbLB5zWyj9QrZ6Ao .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-nbLB5zWyj9QrZ6Ao

2021-04-21 17:42:37 106

原创 bmp格式 8bit与24bit深度相互转换

bmp格式 8bit与24bit相互转换一、实验要求在图像处理软件中生成8bit和24bit深度的BMP文件,编写程序实现不同像素深度文件的相互转换。重点掌握函数定义、缓存区分配、倒序读写、结构体操作。二、算法原理1. 8bit转24bit8bitBMP图像文件包括4部分:位图文件头fileheadertypedef struct tagBITMAPFILEHEADER { WORD bfType; DWORD bfSize; WORD

2021-04-10 17:45:43 3479 2

原创 PNG图像格式解析

本文参考自W3C标准的PNG规范https://www.w3.org/TR/PNG/一、PNG格式概述PNG(Portable Network Graphics)是一种可扩展的文件格式,用于无损,可移植,压缩后的光栅图像存储。PNG提供了GIF的无专利替代,也可以替代TIFF的许多常见用途。支持索引彩色,灰度和真彩色图像,以及可选的Alpha通道,采样深度范围为1到16位。PNG旨在在诸如Web的在线查看应用程序中很好地工作,因此它具有渐进显示选项,可以完全流式传输。PNG同时具有鲁棒性,可以提供文件

2021-03-25 19:10:50 1166

原创 YUV格式与RGB格式图片转换

实验一 YUV格式与RGB格式图片转换一、实验内容1.问题描述课上老师已给出RGB转YUV格式的示例程序,阅读并理解该程序,编写将YUV转换为RGB的程序。将给定的实验数据用该程序转换为RGB文件。并与原RGB文件进行比较,如果有误差,分析误差来自何处。2.实验环境Visual Studio 2019 C语言二、算法原理RGB转YUV的公式:Y = 0.2990R + 0.5870G + 0.1140BU = - 0.1684R - 0.3316G + 0.5B + 128V = 0.

2021-03-14 23:46:49 322

原创 分析比较图像RGB格式和YUV格式的存储概率分布

分析比较图像RGB格式和YUV格式的存储概率分布实验思路两个图片文件down.yuv和down.rgb均为二进制存储的图片文件,像素为256* 256。yuv为4:2:0格式,即1份y对应0.25份u和0.25份v,因此大小为256* 256* 1.5;rgb为每个像素按BGR格式存储信息,因此大小为256* 256* 3。最开始考虑c++编程,但c++很难进行绘图操作,故最终选择python实现代码from multiprocessing import Poolimport numpy as

2021-03-07 23:33:40 172

原创 使用Audacity分析浊音、清音、爆破音时频特性

使用Audacity分析浊音、清音、爆破音时频特性浊音/a/时域波形可以从时域图中观察到浊音具有较强的短时周期性频域波形可以从上图很明显的观察到共振峰,且能量较大。清音/h/时域波形观察到清音不具有浊音的周期性,过零率较高频域波形波形较为平缓,且能量较小爆破音/p/时域波形与清音一样不具有周期性,过零率高,但能量较大频域波形由低频到高频能量逐渐减少。...

2021-03-07 22:40:34 104

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除