使用NCNN的INT8量化方式进行推理

papaofdoudou

已于 2022-08-09 13:06:42 修改

阅读量3.9k

点赞数 7

分类专栏：算法人工智能数学文章标签： c++ 开发语言后端

于 2022-01-14 11:37:47 首次发布

本文链接：https://blog.csdn.net/tugouxp/article/details/122489836

版权

本文详细介绍了使用NCNN框架进行INT8量化的过程，包括编译NCNN、模型量化、验证效果、KL量化原理以及YOLOV4模型的量化推理。量化后模型的权重文件大小减小，但可能导致精度损失。通过分析，揭示了NCNN仅支持对称量化，以及在推理流程中的递归特点。

摘要由CSDN通过智能技术生成

本文以NCNN框架为例，实践量化在推理中的巨大作用，加深对神经网络量化的理解。NCNN当前版本只支对称量化，下面以INT8精度为例介绍NCNN的量化使用方式：

编译NCNN

mkdir build && cd build && cmake ../

进入到build/tools/darknet目录，将来源于darknet的模型文件和权重文件拷贝一份到这里：

wget -c https://github.com/AlexeyAB/darknet/releases/download/darknet_yolo_v4_pre/yolov4-tiny.weights

转换过程如下：

./darknet2ncnn ./yolov4-tiny.cfg ./yolov4-tiny.weights

优化：

./ncnnoptimize /home/czl/ncnn/ncnn/build/tools/darknet/ncnn.param /home/czl/ncnn/ncnn/build/tools/darknet/ncnn.bin yolov4-tiny-opt.param yolov4-tiny-opt.bin 0

同时，也可以得到MAC算力信息：

生成的优化过的模型如下：

检测实战，未优化的模型推理结果：

优化后的模型推理结果：

这里的yolov4其实就是yolov4-tiny,程序中是可以选择：

下载量化校准表图片

下载官方给出的1000张ImageNet图像，很多同学没有梯子，下载慢，可以用下这个链接：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

papaofdoudou

关注关注

7
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

yolov4-tiny+ncnn+int8模型量化推理

qq_41920323的博客

03-22

489

yolov4-tiny的ncnn的int8量化教程，从环境配置到部署

NCNN的人体姿态评估模型，已做int8量化

02-12

可以输出17个点的简易姿态评估模型，我自己的企业级产品就在使用，效果还是不错的，只要背景不是乱得太可以，或者衣服的颜色与背景混合严重，基本上都是可以正常的评估出来的。这个模型的好处就是速度非常快，基本上是所有已知模型中速度最快的一个。包内的.h文件是已经被代码化后的定义文件，直接使用NCNN的二进制接口加载就可以了

1 条评论您还未登录，请先登录后发表或查看评论

ncnn int8量化

m0_37844017的博客

03-30

3480

NCNN 下FP16、FP32速度耗时一般情况下：GPU使用FP16模型<CPU使用FP32模型<GPU使用FP32模型 ncnn int8量化后的改进, 参考链接: https://baijiahao.baidu.com/s?id=1699724039745016586&wfr=spider&for=pc 量化步骤参考 nihui 大佬教程: https://github.com/Tencent/ncnn/wiki/quantized-int8-inference 202

NCNN 学习(3)-Optimize

最新发布

哦豁灬

09-21

1072

NCNN 的 tools 中包含对模型进行优化的代码，主要是和这两个文件。这两个文件里主要是和两个类，继承自Net继承自。这里Net是 NCNN 的基础数据结构之一，用来抽象和管理 NCNN 的模型中的不变部分，主要是模型结构和模型参数。主要是为了做模型优化添加的一个辅助类，主要用于输出模型，是 ncnn 用来做模型优化的主要的一个类，基本上所有的优化 pass，都是在这个类中实现。

NCNN推理

weixin_43999691的博客

07-23

613

ncnn 是一个高性能的神经网络前向计算框架，专门针对移动设备和嵌入式设备设计。它由腾讯优图实验室开发，旨在提供高效的神经网络推理能力，特别是在资源受限的环境中，如智能手机和嵌入式系统。ncnn 被广泛应用于移动端和嵌入式设备上的各种深度学习应用，包括但不限于：图像分类/目标检测/语义分割/人脸识别/图像生成与处理。

NCNN INT8实现

weixin_41521681的博客

03-24

1625

2.4 INT8量化实现-校准实现（python）下一篇详细说说代码实现的细节部分，以及相关的知识，比如我们为什么要做分布的smooth处理。第三章INT8移动端实现在这部分，我将以自顶向下的方式叙述INT8的kernel实现原理及过程，其中包括开源的NCNN INT8版本以及我优化后INT8版本（QNNPACK INT8版本在《QNNPACK调研》中有详细论述，此文略过仅在最后做数据对比）。 3.1 NCNN INT8实现 3.1.1 底层量化处理整体流程在每层计算时是需要..

实操教程｜NCNN+Int8+YOLOv4量化模型和实时推理

CV_Autobot的博客

11-28

1236

作者|pengtougu 编辑| 极市平台原文链接 :https://zhuanlan.zhihu.com/p/372278785点击下方卡片，关注“自动驾驶之心”公众号ADAS巨卷干货，即可获取点击进入→自动驾驶之心【模型部署】技术交流群后台回复【模型部署工程】获取基于TensorRT的分类、检测任务的部署源码！导读本文作者使用NCNN量化YOLOV4模型以及进行推理的全过程，附有相关...

MODNet官方onnx及其转换的ncnn模型、NCNN量化后模型

04-01

3. NCNN量化后模型：`modnet_int8.bin`和`modnet_int8.param`是经过ncnn的量化处理后的模型文件。量化是深度学习模型优化的一种方法，它将模型中的浮点数权重转换为整数，从而减少内存需求和计算复杂性，提高在低...

ncnn发布20210507版本，int8量化推理大幅优化超500%

腾讯开源

05-08

858

ncnn是腾讯开源为手机端极致优化的高性能神经网络前向计算框架。仰赖ncnn社区开发者的贡献，ncnn在2019年年初便已实现int8模型量化和推理。但因后来失去社区开发者的持续投入，nc...

NCNN中的模型量化解决方案：源码阅读和原理解析

沉迷单车的追风少年

05-29

538

去年NCNN发布了模型量化的解决方案，作为目前中国大陆被使用最多的端侧模型推理解决方案，NCNN开源的代码值得认真阅读和研究。这篇博客笔者和大家一起探索NCNN的模型量化部分，希望大家在NCNN的世界里玩得开心。

ncnn模型推理全过程

m0_49996100的博客

12-09

1305

ncnn推理教程

ncnn模型 int8量化

二分掌柜的

06-27

994

flyfish

推理量化（INT8 Quantization)

smartcat2010的博客

05-30

394

1. absmax: 以fp16的0，对齐signed int8的0;矩阵里fp16所有数的绝对值里最大的值，作为127，得到量化Scale值；乘法计算的时候，直接INT8*INT8=INT32，再缩放至INT8以进行下次计算；fp16矩阵里的(max-min)映射到255这个范围，fp16的0映射到int8的Z；所以，Ai*Bi矩阵计算完成后，还要加上Ai矩阵乘以系数，再加上Bi矩阵乘以系数，再加ZA*ZB常数，该int32矩阵再缩放到int8，才是结果；用的是absmax量化，即0是中点；

模型杂谈：使用 IN8 量化推理运行 Meta “开源泄露”的大模型（LLaMA）

折腾技术

03-13

6334

接着之前文章《模型杂谈：快速上手元宇宙大厂 Meta “开源泄露”的大模型（LLaMA）》一文中的话题，继续聊聊如何使用 INT8 量化的方式来让低显存的设备能够将模型运行起来。

Android ncnn推理识别

程序猿的视界

04-02

2368

1、模型准备需要onnx2ncnn转化的param和bin文件。以resnet18为例：用pytorch训练的模型文件经onnx及简化后，在转化为ncnn框架下文件格式。转化流程：pt -> onnx -> onnx-sim ->param、bin 也就是上篇文章获得的res18.param、res18.bin两个文件 2、下载安卓编译ncnn库下载链接：Releases · Tencent/ncnn · GitHub 3、创建工程 3.1 选native c++

【NCNN】腾讯ncnn推理框架的简介及安装

种一棵树最好的时间是十年前，其次是现在

07-20

9839

ncnn（Ncnn Convolutional Neural Network）是一个轻量级的高性能深度学习框架，由腾讯公司开发。它专门为移动设备和嵌入式设备优化，旨在提供高效的推理性能和低内存占用。以下是ncnn的一些主要特点和优势：轻量级和高性能：ncnn被设计为轻量级框架，具有高效的推理性能。它使用优化的计算图和内存管理策略，以最大程度地减少内存占用和计算开销。跨平台支持：ncnn支持多种操作系统和硬件平台，包括Android、iOS、Linux、Windows等。

NCNN+Int8+YOLOv4量化模型和实时推理

sinat_16423171的博客

05-21

915

NCNN+Int8+YOLOv4量化模型和实时推理注：本文转载于https://zhuanlan.zhihu.com/p/372278785，作者pengtougu，计算机研二硕士。一、前言 2021年5月7日，腾讯优图实验室正式推出了ncnn新版本，这一版本的贡献毫无疑问，又是对arm系列的端侧推理一大推动，先剖出nihui大佬博客上关于新版ncnn的优化点：继续保持优秀的接口稳定性和兼容性 API接口完全不变量化校准table完全不变 int8模型量化流程完全不变（重点是这个！！！

ncnn模型部署——onnx模型转ncnn模型并推理可执行程序（resnet18例子）

qq_40280673的博客

03-30

6053

ncnn为用户提供了一系列的模型转换工具，能够轻松地将caffe、onnx等格式的模型转换为ncnn可以识别的格式。在源代码编译完成后，这些工具会被存放在ncnn/build/tools目录下。在本次的示例中，使用了onnx2ncnn工具，将在pytorch中导出的resnet18的onnx模型转换为ncnn模型，并进行了推理。

NCNN int8量化

09-06

NCNN int8量化是指在NCNN框架中将CNN模型从float32转换为INT8的过程。这种量化方法可以减小模型的大小、提升运行速度，而对精度的降低相对较小。在实际中，有多种方法可以实现NCNN int8量化，其中包括基于腾讯的NCNN框架、Tensorflow和Nvidia的TensorRT。其中，本回答将介绍一种基于NCNN框架的实践方法。在这个方法中，首先需要使用Caffe-Int8-Convert-Tools工具将Caffe模型转换为int8格式，然后在NCNN框架上运行。具体过程可以参考中提供的链接。接下来，我将以自顶向下的方式叙述NCNN int8量化的kernel实现原理及过程。首先，需要了解NCNN框架中的INT8版本和优化后INT8版本。INT8版本是NCNN的开源版本，而优化后的INT8版本是经过优化处理后的版本。在这两个版本中，都包含了INT8的kernel实现。在INT8的kernel实现中，主要包括对权重和特征图的量化和反量化操作。量化操作将浮点数转换为INT8格式，而反量化操作则将INT8格式转换回浮点数格式。这样可以实现模型参数的压缩和运算速度的提升。除了量化和反量化操作，还需要对卷积操作进行优化。通过对卷积操作进行INT8计算，可以降低计算复杂度，提高计算速度。优化的卷积操作还可以使用SIMD指令集来进行向量化计算，进一步提升计算效率。总结来说，NCNN int8量化是将CNN模型从float32转换为INT8的过程，可以通过Caffe-Int8-Convert-Tools工具进行转换，并在NCNN框架中运行。量化和反量化操作以及优化的INT8卷积操作是实现这一过程的关键。你可以参考中的内容了解更多细节。123 #### 引用[.reference_title] - *1* *2* [CNN模型 INT8 量化实现方式（一）](https://blog.csdn.net/zhangjunhit/article/details/84562334)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [NCNN INT8实现](https://blog.csdn.net/weixin_41521681/article/details/115156819)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]