- 博客(9)
- 收藏
- 关注
原创 H.264码流分析
一、选择一个.mp4或者.264文件。二、在码流分析仪软件中打开该文件,从几个层次进行分析:选择文件 (1)profile_idc标识当前H.264码流的profile。H.264中定义了三种常用的档次profile:基准档次:baseline profile;主要档次:main profile;扩展档次:extended profile;在H.264的SPS中,第一个字节表示profile_idc,根据profile_idc的值可以确定码流符合哪一种档次。判断规律为:profile_idc = 6
2022-07-11 21:43:47
273
1
原创 MPEG音频编码实验
MPEG的基本编码思路(感知编码的基本思路)分析信号,去掉不能被感知的部分:PCM码流分别输入到上下两条线,上方最终作为编码的源数据形成MPEG编码结果。下方使用FFT对信号进行分析,经过心理声学模型计算信号中听觉无法感知的部分(计算噪声掩蔽效应)。为编码提供比特分配的信息。时-频分析的矛盾较高的时间分辨率和较高的频率分辨率时不可兼得的。为了实现较高的时间分辨率,势必要减少采样长度,确保在短暂冲击信号的情况下,编码的声音信号具有足够高的质量(尽量少地受到前后信号的影响),因此编码中以32个样本(框图中的
2022-07-10 16:09:20
188
原创 JPEG原理分析及JPEG解码器的调试
一、简介JPEG( Joint Photographic Experts Group)即联合图像专家组,是用于连续色调静态图像压缩的一种标准,文件后缀名为.jpg或.jpeg,是最常用的图像文件格式。其主要是采用预测编码(DPCM)、离散余弦变换(DCT)以及熵编码的联合编码方式,以去除冗余的图像和彩色数据,属于有损压缩格式,它能够将图像压缩在很小的储存空间,一定程度上会造成图像数据的损伤。尤其是使用过高的压缩比例,将使最终解压缩后恢复的图像质量降低,如果追求高品质图像,则不宜采用过高的压缩比例。JPEG的
2022-07-10 13:18:02
795
原创 LZW词典编解码
数字查找树节点结构体:初始化: 向数字查找树中添加新节点:查找某个短语是否在词典里:将文件读写封装为按比特流输入输出:LZW编码:解码:编码测试: 解码测试: 针对不同文件:由此可见LZW编码算法在某些文件格式上表现出了很好的压缩效果,而在大部分现有的自带压缩文件格式中压缩效果并不理想,还存在很大优化空间。...
2022-07-07 20:34:04
160
原创 RBG/BMP TO YUV
RBG转YUVRGB文件 YUV文件RGB与YUV相互转换公式Y=0.299R+0.587G+0.114BR−Y=0.701R−0.587G−0.114BB−Y=−0.299R−0.587G+0.886BU=-0.1684R-0.3316G+0.5BV=0.5R-0.4187G-0.0813B RGB2YUVmain.cppBMP2YUV.hmain.cpp将5张图片转换成YUV,分别重复50次,再输出到文件中。使用ffplay播放yuv文件:...
2022-07-06 21:52:44
181
原创 wav文件分析
一、简介二、wav文件格式 它具有RIFF(Resource Inter⁃change File Format)格式。RIFF格式的wav文件由若干个Chunk( 块) 组 成 ,按 顺 序 为 RIFF WAVE Chunk、Format Chunk、FactChunk(可选)和Data Chunk。每个块都有固定而且类似的格式,一般第 1 部分是块的 ID,作为标识,4 个字节大小,紧跟其后的是该块的大小,也是用4个字节表示,低字节表示低位,高字节表示高位RIFF ChunkData Chunk
2022-07-06 20:28:29
242
原创 使用Audacity软件进行分析和图片RGB熵计算
1.录制三个元音音频,通过音频分析工具软件观察、总结时域波形、频谱的特点a时域:频域:o时域:频域:e时域:频域:由三个时域图可观察到元音近似于短时周期信号,语音信号具有短时平稳性。频域图可观察到明显的共振峰2.编程实现RGB文件三通道分量的熵计算#include<iostream>using namespace std;const int width = 256; //图像宽度const int he...
2022-03-31 19:15:41
347
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人