神经网络量化（2）量化方法

最新推荐文章于 2023-08-03 11:21:31 发布

迷途小牛马

最新推荐文章于 2023-08-03 11:21:31 发布

阅读量402

点赞数 1

文章标签： qt 开发语言

本文链接：https://blog.csdn.net/liulibo1/article/details/130154650

版权

三种量化思路：

1. 对称量化：

float value=1.0;
float scale=0.1;
int qt32=round(value/scale);
chat qt8=clip(qt32,qt_min,qt_max);

//因为最后结果关于0呈现对称结构，所以称为对称量化

2. 非对称量化：

float value=1.0;
float scale=0.1;
int qt32=round(value/scale+offset);
chat qt8=clip(qt32,qt_min,qt_max);
//因为offset的存在，我们可以将value转换到非零区域，所以qt_min为0，即不对称

3. 移位量化：

float value=1.0;
float scale=0.1;
int qt32=round(value<<offset);
chat qt8=clip(qt32,0,qt_max);
//因为有些设备不能进行浮点运算，所以，我们通过一维将value转为整数。这叫移位量化

对于Tensor的两种量化思路：

1. Tensor整体使用一个scale和offset：会出现有些数据严重失真

2. Tensor分通道使用多个scale和offset：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

迷途小牛马

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
神经网络量化（2）量化方法

1. Tensor整体使用一个scale和offset：会出现有些数据严重失真。
复制链接

扫一扫

移位量化（对数量化）

hey-yahei

03-08

4364

原文链接：https://www.yuque.com/yahei/hey-yahei/shift_quantization 移位量化也可以称为对数量化，将数值从浮点数的形式量化为一个整数或定点数，但它与线性量化不同，两个相邻数之间是在以2为底的对数域上均匀分布的，这使得实际推理当中可以直接通过移位运算来快速实现，同时也拥有随比特数增长而指数增长的大动态范围。移位量化既可以只量化权重（对激活值移位）...

定点浮点 神经网络 量化_神经网络量化方法

weixin_39723920的博客

12-22

2024

神经网络虽然在多个领域取得了非常巨大的成就，但是其本质是大量参数的拟合和泛化，如果想处理更加复杂的任务，在没有过拟合的情况下，增加训练数据和加大网络规模无疑是简单有效的手段。现实情况就是这么做的，但是巨大的参数量和复杂的网络结构造成了两个主要的问题：模型体积和运算速度。这两个问题会带来诸如内存容量，内存存取带宽，移动端还有电量消耗等一系列问题，大大限制了神经网络的应用场景。背景介绍为了解决这些问题...

参与评论您还未登录，请先登录后发表或查看评论

神经网络的量化与训练(论文翻译讲解)

qq_45469266的博客

08-16

708

谷歌出品量化方案

Pytorch模型量化

凌逆战的博客

10-25

1万+

在深度学习中，量化指的是使用更少的bit来存储原本以浮点数存储的tensor，以及使用更少的bit来完成原本以浮点数完成的计算。这么做的好处主要有如下几点：更少的模型体积，接近4倍的减少；可以更快的计算，由于更少的内存访问和更快的int8计算，可以快2~4倍。一个量化后的模型，其部分或者全部的tensor操作会使用int类型来计算，而不是使用量化之前的float类型。当然，量化还需要底...

用神经网络实现一次加法运算

staple

06-24

819

按照移动距离和假设，如果两张图片不重合点的数量分别是a和b，则网络收敛的迭代次数反比与a+b，也就是网络的迭代次数是a+b的函数n=f（a+b）。因此对二值化图片实现一次收敛，就相当于完成了一次加法运算。...

深度学习神经网络的数学基础（二）

qq_39220334的博客

03-22

781

张量运算一、逐元素运算1.加法运算2.relu运算二、张量点积1.向量间的点积2.矩阵和向量间的点积3.矩阵间的点积三、张量变形四、广播1.加法运算2.maximum运算总结一、逐元素运算 **逐元素运算独立地应用于张量的每个元素。**为了更好地理解逐元素运算，下面给出relu运算和加法运算的逐元素实现，使用for循环。 1.加法运算 def naive_add(x,y): assert len(x.shape) == 2 #x,y是Numpy的2D张量 assert x.sha

深度神经网络量化算法基础理论

Joejwu的博客

07-03

524

参考之前博客中的量化分级，本文将主要关注Level3的量化方法，即通过在训练过程中模拟量化，来尽可能地降低由量化带来的精度损失，其属于量化感知训练一类，本小节将介绍的即为量化感知训练方法的一些基础理论。最后从量化粒度的角度，可将量化分为逐通道量化与逐层量化，例如在卷积层中，同一层的每个卷积核(Filter)拥有独立的量化参数则为逐通道量化，若每个卷积核共享同一组量化参数，则为逐层量化。为便于理解，下面将通过[67][158]中的量化方案来阐述相关概念，其中非对称量化的计算如式2.6中所示。

学习向量量化神经网络

10-05

LVQ神经网络由输入层、隐含层和输出层三层组成，输入层与隐含层间为完全连接，每个输出层神经元与隐含层的神经元的不同组相连接，每个隐含层神经元只能和一个输出层神经元连接，但每个输出层神经元可以连接多个隐含...

基于Octave卷积的混合精度神经网络量化方法.pdf

09-25

基于Octave卷积的混合精度神经网络量化方法基于Octave卷积的混合精度神经网络量化方法是指一种神经网络量化方法，该方法利用Octave卷积将输入特征图的高频和低频成分进行分离，然后分别对高低频分量应用不同位宽的...

dart-neuquant:神经网络图像量化

06-16

右边是量化后只有 256 种颜色的相同图像：用法该算法将 32 位 RGBA 图像量化为 8 位颜色。通过调整采样因子，该算法可以缓慢地产生极高质量的图像，或者在合理的时间内产生良好的图像。采样因子为 10 可显着...

基于自注意力神经网络的多因子量化选股问题研究

12-01

在众多量化投资策略中,多因子选股策略因其稳定的收益而备受投资者青睐。本文借助Tushare Pro金融大数据平台和聚宽...运用自注意力神经网络模型,通过过去60个交易日的因子数据,预测各成分股未来一个月的价格变动趋势,

WAGE量化神经网络 CIFAR10 复现

01-06

1. **WAGE量化神经网络**：WAGE（Weighted Average Quantized Element-wise）是一种针对深度学习模型的量化方法，旨在减少模型的计算复杂性和存储需求，从而提高在资源有限的设备上的运行效率。它通过对权重进行量化...

【科研小小白】神经网络参数（weight权重、bias偏移量）初始化方法（未完待续）

最新发布

imblackcat的博客

08-03

1257

在神经网络中，参数的初始化和处理是非常重要的步骤，因为它们对模型的训练速度和性能有着直接的影响。：权重的初始化通常需要遵循一些特定的分布，如均匀分布、正态分布或者是特定的常数。：权重归一化是一种常用的参数处理方法，可以帮助提高模型的训练速度和性能。：在神经网络的训练过程中，权重的更新是通过反向传播和优化算法来实现的。PyTorch的模块提供了一系列的优化算法，如SGD、Adam和RMSProp等。：权重正则化是一种防止过拟合的技术，常见的方法有L1正则化和L2正则化。在PyTorch中，可以在优化器中设置。

神经网络量化入门--Add和Concat

AI小男孩的专栏

03-14

2237

神经网络量化入门系列第六篇：Add和Concat的量化

对称量化VS非对称量化

qq_36936443的博客

07-29

4180

非对称量化相比于对称量化而言，无需遵循0不变的映射规则，显然具有更好的动态映射范围，并且当面临一些特殊情况，如对于经过relu的激活值（全为非负值），使用对称量化时，需要仔细考虑使用符号量化，还是无符号量化。可以看到，后两项都是常量，可以提前离线计算好，但额外多出的第二项相比于对称量化而言，非对称量化有着较大的额外计算开销。综合以上分析，硬件支持的前提下，量化时对激活值X使用非对称量化，对权重值W使用对称量化，或许是一种更适宜的量化方案。其中r为量化前数值，S为缩放因子，q为量化后数值，Z表示零点。...

虚拟贴图理论之寻址

liran2019的博客

09-22

567

虚拟贴图第一个需要解决的问题就是寻址问题。我们需要将虚拟贴图的uv坐标转换到对应的物理缓存中。我们使用一张Indirect texture贴图存储了转换相关的数据。如下图：每一个虚拟Page都会对应indirect texture中的一个像素，通过像素中存储的参数，我们可以将虚拟地址转换到物理地址。接下来我们就探讨一下indirect texture中存储的参数到底是什么？首先我们必须先了解一个概念，虚拟Page代表的是一块uv坐标，这块uv坐标中的所有坐标变换使用相同变换参数，如下图: A点

【TensorRT】2、神经网络中的量化

呆呆的猫的博客

11-18

3958

本文主要介绍神经网络在部署时的量化

Tensorflow 模型量化（Quantizing deep convolutional networks for efficient inference: A whitepaper 译文）

神经网络量化（2） 量化方法

神经网络量化（2）量化方法