计算机视觉+人工智能面试笔试总结——模型量化

最新推荐文章于 2024-03-06 16:54:25 发布

fpga和matlab

最新推荐文章于 2024-03-06 16:54:25 发布

阅读量810

点赞数 1

分类专栏： ★求职1:深度学习/FPGA/机器视觉/算法手撕代码文章标签：人工智能深度学习深度学习面试计算机视觉面试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ccsss22/article/details/126613469

版权

★求职1:深度学习/FPGA/机器视觉/算法手撕代码专栏收录该内容

127 篇文章 54 订阅 ¥39.90 ¥99.00

订阅专栏

目录

1.模型量化优点

2.常用模型量化的方案

4.量化的分类

5.线性量化概述

6.定点和浮点

8.量化方法的改进

9.最大最小值（MinMax）

10.滑动平均最大最小值(MovingAverageMinMax)

1.模型量化优点

模型量化是指将神经网络的浮点算法转换为定点。量化有一些相似的术语，低精度（Low precision）可能是常见的。

- 低精度模型表示模型权重数值格式为 `FP16`（半精度浮点）或者 `INT8`（8位的定点整数），但是目前低精度往往就指代 `INT8`。
- 常规精度模型则一般表示模型权重数值格式为 `FP32`（32位浮点，单精度）。
- 混合精度（Mixed precision）则在模型中同时使用 `FP32` 和 `FP16` 的权重数值格式。 `FP16` 减少了一半的内存大小，但有些参数或操作符必须采用 `FP32` 格式才能保持准确度。

2.常用模型量化的方案

在实践中将浮点模型转为量化模型的方法有以下三种方法：

1. `data free`：不使用校准集，传统的方法直接将浮点参数转化成量化数，使用上非常简单，但是一般会带来很大的精度损失，但是高通最新的论文 `DFQ` 不使用校准集也得到了很高的精度。
2. `calibration`：基于校准集方案，通过输入少量真实数据进行统计分析。很多芯片厂商都提供这样的功

了解本专栏

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
1
评论
计算机视觉+人工智能面试笔试总结——模型量化

与非线性量化不同，线性量化采用均匀分布的聚类中心，原始浮点数据和量化后的定点数据存在一个简单的线性变换关系，因为卷积、全连接等网络层本身只是简单的线性计算，因此线性量化中可以直接用量化后的数据进行直接计算。...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

fpga和matlab 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。