自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 Pytorch使用交叉熵损失函数CrossEntrophy一些需要注意的细节

Pytorch使用交叉熵损失函数CrossEntrophy一些需要注意的细节CrossEntrophy()交叉熵损失函数,是一种在多分类任务,多标签学习中效果较好的损失函数。criterion = nn.CrossEntropyLoss()...# train... for i, (features, length, label) in enumerate(train_loader): ... loss = criterion(pr

2021-02-08 22:32:28 1575

原创 H.264编解码程序调试(JM18.6)

H.264介绍H.264是由ITU-T视频编码专家组(VCEG)和ISO/IEC运动图像专家 组(MPEG)联合组成的联合视频组(JVT,Joint Video Team)提出的新一代数字视频压缩标准。与之前的标准一样,同样采用了帧内预测,运动预测,变换编码,熵编码结合的方法(这些方面和之前的标准一致,即混合编码器的基本框架),同时在此基础上做出一定改动(主要改动集中在功能模块的具体细节上),以适应更高的编码效率,更简洁的表达形式等要求。在应用方面,H.264更注重对移动和IP网络的适应,采用分层技术将

2020-08-05 21:35:39 1346 1

原创 随机信号参数建模法

在进行语音信号编码传输时,往往对语音信号信源进行建模,然后对模型参数进行编码,只传送编码后的模型参数。这样在解码端获得模型参数重建信源模型后,即可获得重建后的语音信号。信号的现代建模法是建立在具有最大的不确定性基础上的预测。其广义定义为:随机信号x(n)由白噪w(n)激励某一确定系统的响应。确定了白噪就,研究随机信号就等价于研究产生随机信号的系统。对平稳随机信号,三种常用的线性模型为:AR模型(自回归模型,Auto-regression model)MA模型 (滑动平均模型 Moving av

2020-06-21 15:03:15 463

原创 MPEG音频编码 基本原理和C语言代码分析

背景MPEG(Moving Picture Experts Group)在汉语中译为活动图像专家组,特指活动影音压缩标准。MPEG 音频文件是MPEG1 标准中的声音部分,也叫MPEG 音频层,它根据压缩质量和编码复杂程度划分为三层,即 Layer-1、Layer2、Layer3,且分别对应MP1、MP2、MP3 这三种声音文件,并根据不同的用途,使用不同层 次的编码。MPEG音频编码的层次越高,编码器越复杂,压缩率也越高,MP1 和MP2 的压缩率分别为4:1 和 6:1-8:1,而MP3 的压缩率则

2020-06-10 23:31:22 1366

原创 傅立叶变换的时移特性 时域不同的信号有相同的幅频特性

假设有如此两路输入信号:clear;clc;N = 1000;fs = 100;dt = 1/fs;t = 0:dt:N*dt-dt;xt1 = ones(1, N);t1 = 101:200;xt1(101:200) = cos((t1-100)*2/pi);xt2 = ones(1, N);t2 = 801:900;xt2(801:900) = cos((t2-800)*2/pi);xf1 = fft(xt1);xf2 = fft(xt2);figure(1);subpl

2020-05-31 16:25:12 1457

原创 QMF滤波器组设计(QMFB) matlab实现

QMF滤波器组简介QMF即正交镜像滤波器组。用于子带信号分解为多个信号,从而降低信号带宽,分解后的各路信号通过各自的通道滤波。大致流程为:在分析滤波器一侧,输入信号被分为k个子频带信号通过抽取降低频带利用率在综合滤波器一侧,通过零内插值和带通滤波重建原来的信号。此文用QMFB。即两通道正交镜像滤波器组为例进行设计。QMFB设计系统框图如下:其中输入信号为x(n),分别被两个滤波器(低通和高通)分为两个子频带信号。两同通道信号分别进行2抽取,2插值后再通过带通滤波器后恢复为原来信号。

2020-05-30 11:35:43 5224 1

原创 实验五 JPEG解码

JPEG压缩编码原理简介一般来说JPEG有两种基本压缩方法:有损压缩:以DCT为基础,压缩比较高。无损压缩:又称预测压缩,以二维DPCM为基础。本文讨论基于DCT的压缩方法,其基本流程框图如下:(其实这张图也不是特别全面)我们假设输入图像为f(x,y),对其编解码过程进行简单描述:1.预处理一般将输入信息转为YUV空间进行处理。将输入图像进行像块分割,对亮度信息分成8*8的像块。直流电平下移,即直流电平下移2^7=128,提高编码效率。2.DCT变换即离散余弦变换,目的是去除空间

2020-05-25 15:36:29 1116 3

原创 DPCM预测误差系数推导

DPCM简介在如图所示的DPCM预测系统中,xk为输入信号,ek为预测误差信号。这是利用信息前后关联性的编码方法。其中预测误差为:e(k)=x(k)−x′(k−1)e(k)=x(k)-x'(k-1)e(k)=x(k)−x′(k−1)我们用最小均方误差MSE来描述误差的大小:MSE=E[e(k)2]=E[d2]MSE=E[e(k)^2]=E[d^2]MSE=E[e(k)2]=E[d2]信噪比SNR:SNR=E[s(k)2]E[d(k)2]SNR=\frac{E[s(k)^2]}{E

2020-05-16 20:30:07 619

原创 最小二乘法——梯度下降法,牛顿法,高斯牛顿法

在DPCM的学习中,为了自适应确定最佳预测系数需要用到最小二乘法。在这三种解决最小二乘法的思路中,都用到了泰勒多项式的相关思路。本文首先介绍泰勒多项式的相关知识。泰勒展开式假设有这么一个函数,f(x)=cos(x).大家都知道这是基础中的基础的余弦函数。现在有这么一个问题:能不能找到一个式子可以复制cos(x)的效果呢?这就是当年泰勒所研究的问题。大致思路是:选定一个点x0,使我们要创造的式子g(x)在x0处满足:g(x0)=0g’(x0)=0g’’(x0)=0…以此类推我们在高

2020-05-16 20:26:07 1141

原创 实验(四)DPCM编码的实现和分析

DPCM编码原理简介DPCM全称差分脉冲编码调制(Differential Pulse Code Modulation),是一种利用相邻像素的相关性去除空间冗余信息达到压缩目的的算法。其中xn为输入信号,Q为量化器,dn=pn+xn为预测误差,P为延时器。本实验采用前向预测,即每个像素左边的像素,大致算法如下:以8bit图像为例,收到的灰度取值为[0,255],与前一个像素作差和得到误差...

2020-05-05 16:08:29 2104

原创 实验三 LZW编解码算法实现与分析

LZW简述本部分参考wiki https://en.wikipedia.org/wiki/Lempel%E2%80%93Ziv%E2%80%93WelchLZW压缩算法在1978年提出,由 Abraham Lempel, Jacob Ziv, and Terry Welch发明,因此称为LZW算法,是第一种在全世界计算机中广泛应用的压缩算法。LZW是一种自适应词典编码,即对文件中的...

2020-04-22 22:23:59 1315

原创 实验二:TGA文件格式转化为YUV

实验目的:熟悉TGA图像文件格式,将TGA格式的图像转换成YUV文件**(4:2:0).**简单回顾YUV文件的存储方式:TGA文件格式简介参考:Truevision TGA FILE FORMAT SPECIFICATION Version 2.0 https://en.wikipedia.org/wiki/Truevision_TGATGA格式图像文件的数据可以大致分为五大部...

2020-04-09 15:32:37 283

原创 (四)PNG文件格式分析

之前的学习中,接触的都是没有文件头的raw文件。raw文件中,数据直接以一种格式储存在文件中,没有出数据之外额外的数据。而通常为了电脑处理数据更加便利快捷,会根据一定的结构和规则组织图像数据的存储,添加辅助数据,为文件添加文件扩展名。电脑通过这些辅助数据就可以确定文件的存储格式,从而通过特定的算法进行高效的数据提取分析。Y一般来说,对所有二进制数据以字节为基本单位进行分析处理。对图像,有JPG,P...

2020-03-29 17:18:35 1329

原创 实验(一):彩色空间转换实验 RGB—YUV

实验目标:将所给的RGB空间的 down.rgb 转换为YUV色彩空间的 down.yuv,再将其重新转换为RGB空间,分析结果一.rgb与yuv格式文件的数据要对文件中的数据进行处理,首先当然要了解这种文件格式的数据特点。说是rgb,yuv文件,其实本质上都是没有文件头的raw文件,文件头开始读就直接是数据。而rgb与yuv的数据存储也有一定的规范,即如下图所示: 其中YUV的...

2020-03-23 21:17:17 592

原创 用C/C++读取rgb格式文件数据并分析其概率分布

rgb格式文件并不多见。其存储方式为B G R Y 的数值顺序存储以下图为例:将此图的rgb格式文件用FlexHEX打开后是这样的:其中存储数据的顺序为B G R Y我们用codeblock编译C++语言文件对其进行分析代码如下:#include “iostream”#include"stdio.h"#include"math.h"using namespace std;d...

2020-03-14 18:29:30 1043

原创 主成分分析法PCA介绍及其基本原理

PCA的主要目的:降维在许多领域的研究学习中,往往需要同时是处理大批量的数据以进行研究。这些数据的处理是有很多维的,处理起来非常困难,即使交给计算机也需要很复杂的算法。如果不同变量之间有复杂的相关性,算法则会更加复杂,难以处理。显然也不能单独对各个变量进行分析。这种情况下,需要另辟蹊径。这里需要一种方法,可以在减少运算复杂性的同时尽量最最小化损失的信息量,也就是PCA了。所谓减少运算复杂性,...

2020-02-23 16:19:16 1946 1

原创 编程常用数据类型

各语言通用常用的数据可分为以下几种:1.整数这是一种整数型数据变量,在各种语言中都有广泛的应用,存储方式为二进制补码。一般长度为四个字节。根据具体数据的取值范围,还可分为长整型long(4byte),整型int(4byte),短整型short(2byte)等。根据有无符号有signed int, unsigned int。整形的计算方法有数学运算与逻辑运算,其中值得一提的是一些语言中(如C语...

2020-02-17 09:38:31 2814

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除