自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 H.264编码

H.264是由ITU-T视频编码专家组(VCEG)和ISO/IEC运动图像专家 组(MPEG)联合组成的联合视频组(JVT,Joint Video Team)提出的新一代数字视频压缩标准。与之前的标准一样,同样采用了帧内预测,运动预测,变换编码,熵编码结合的方法(这些方面和之前的标准一致,即混合编码器的基本框架),同时在此基础上做出一定改动(主要改动集中在功能模块的具体细节上),以适应更高的编码效率,更简洁的表达形式等要求。在应用方面,H.264更注重对移动和IP网络的适应,采用分层技术将编码和信道分离开

2020-09-04 16:48:27 226

原创 随机信号的参数建模法

认为随机信号x(n)是由白噪w(n)激励某一确定系统的响应,只要白噪的参数确定了,研究随机信号就可以转化成研究产生随机信号的系统。对平稳随机信号,三种常用的线性模型分别是 AR 模型(自回归模型),MA 模型(滑动平均模型 )和 ARMA 模型(自回归滑移平均模型 )。MA模型随机信号 由当前的激励x(n)和若干次过去的激励w(n-k)线性组合产生:该模型的系统函数是:q 表示系统阶数,系统函数只有零点,没有极点,所以该系统一定是稳定的系统,也称为全零点模型,用 MA( q )来表示。A

2020-06-21 21:13:12 264

原创 MPG音频解码

单纯看上方一条线是含有可变参量的编码系统,先由滤波器分为若干个子带后分别进行量化。下方一条线则根据心理声学模型动态的为上方一条线提供参量。人耳的听觉特性非常复杂,如果想尽可能高效的进行压缩,必须结合心理声学模型。人耳对低频更加敏感,25个临界频带中频率越高,临界频带的宽度越大,这也使将频率均分进行编码有许多缺点。程序的基本框架1.对音频信号进行32子带的滤波2.判断是否为立体声模式3.计算这一帧的比例因子,并计算这一帧的比例因子选择信息4.使用相应的心理声学模型计算心理声学掩蔽水平5..

2020-06-14 21:41:17 276

原创 完全重建QMF滤波器组的设计

matlab代码N=41;w=0.43;[h0,h1,g0,g1]=firpr2chfb(N,w);[H1z,w]=freqz(h0,1,512);H1_abs=abs(H1z);H1_db=20*log10(H1_abs);[H2z,w]=freqz(h1,1,512);H2_abs=abs(H2z);H2_db=20*log10(H2_abs);figure(1); plot(w/pi,H1_db,'-',w/pi,H2_db,'--'); axis([0,1,-100,10]);

2020-05-31 21:40:23 236

原创 JPEG原理分析及JPEG解码器的调试

JPEG编码原理JPEG 是Joint Photographic Experts Group(联合图像专家小组)的缩写,是第一个国际图像压缩标准。.jpeg/.jpg是最常用的图像文件格式,是一种有损压缩格式。JPEG编码框图如下图所示:对于灰度级是2n的像素,通过减去2n-1,将无符号的整数值变成有符号数;对于n=8,即将0255的值域,通过减去128,转换为值域在-128127之间的值。这样做的目的是: 使像素的绝对值出现3位10进制的概率大大减少。(2)8x8 DCT变换DCT变换是指对

2020-05-31 19:57:41 268

原创 2020-03-15

第三次作业#include<stdio.h>#include<iostream>#include<math.h>using namespace std;int w = 256;int h = 256;unsigned char r[65535];unsigned char g[65535];unsigned char b[65535];do...

2020-05-20 13:45:43 97

原创 2020-02-17

2020-05-20 13:44:14 122

原创 最小二乘法--梯度下降法 牛顿法 高斯牛顿法

最小二乘法最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。梯度下降法梯度下降法又被称为最速下降法(Steepest descend method),其理论基础是梯度的概念。梯度与方向导数的关系为:梯度的方向与取得最大方向导数值的方向一致,而梯度的模就是函数在该点的方向导数

2020-05-18 10:08:24 1027

DPCM编码

#include<iostream>#include<stdio.h>using namespace std;int lianghua(int);unsigned char lianghuaid(int);void main(){ FILE* inputYUV = NULL; FILE* outputYUV = NULL; FILE* wuchaYUV = NULL; FILE* P_ORIPHOTO = NULL; FILE* P_WUCHAPHOTO =

2020-05-10 18:35:10 311

LZM编码

补充后的LZWDecode函数void LZWDecode( BITFILE *bf, FILE *fp){ int character; int new_code, last_code;//new_code为课中所讲的C,last_coed为课中所讲的P int phrase_length; unsigned long file_length; file_length = Bits...

2020-04-26 17:26:26 666

原创 TGA2YUV444

先用二进制编辑器打开tga文件,文件总长度为480018字节,文件第13-16字节表示图像大小,图片为400*400无压缩的文件,因此图像数据为480000字节,前18字节为图像信息。查找得到TGA文件头的相关信息如下表:因为仍然是无压缩采用RGB表示的图片,所以借用上次实验RGB2YUV的代码,除读取文件头的代码外再在其基础上做少量修改。由于文件第一个字节的图像信息字段为0,因此图像数据...

2020-04-12 13:24:30 128

原创 PNG文件的分析

图片如下,为微信截图保存的54*54的PNG文件二进制数据如下首先是8个字节的文件头标志接下来四个字节0000 000D表示了IHDR部分的长度,为13字节再后面四个字节为IHDR标识后面4+4个字节表示图片的宽和高,均为5408 表示色深,这里是2^8=256,即256色的图像06 颜色类型,查阅文件可知这是带α通道数据的真彩色图像00表示压缩方法00表示滤波器方法00表...

2020-03-30 17:25:40 563

原创 RGB与YUV文件的互转

RGB转YUV公式Y=0.2990R+0.5870G+0.1140BU=-0.1684R-0.3316G+0.5B+128V=0.5R-0.4187G-0.0813B+128YUV转RGB公式R=Y+1.13983*(V-128)G=Y-0.39465*(U-128)-0.58260*(V-128)B=Y+2.03211+(U-128)原始的RGB文件(不知道为什么YUVViewe...

2020-03-29 18:25:10 194

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除