tensorflow 模型小型化_简易量化配置文件说明_昇腾CANN（20.1）_推理场景_开发辅助工具指南_模型小型化工具使用指南（TensorFlow）_附录_华为云...

最新推荐文章于 2024-06-21 13:59:32 发布

余楚客

最新推荐文章于 2024-06-21 13:59:32 发布

阅读量240

点赞数

文章标签： tensorflow 模型小型化

本文链接：https://blog.csdn.net/weixin_31131927/article/details/113021313

版权

本文档详细介绍了TensorFlow模型小型化过程中calibration_config.proto文件的参数设置，包括批量数量、激活偏移、跳过层配置等。此外，还提供了ARQ和FMR量化算法的配置选项，以及如何通过全局和特定层配置来实现模型量化。

摘要由CSDN通过智能技术生成

calibration_config.proto文件参数说明如表1所示。

表1calibration_config.proto参数说明消息

是否必填

类型

字段

说明

AMCTConfig

模型小型化工具的简易量化配置。

optional

uint32

batch_num

量化使用的batch数量。

optional

bool

activation_offset

数据量化是否带offset。

repeated

string

skip_layers

不需要量化层的层名。

repeated

string

skip_layer_types

不需要量化的层类型。

optional

CalibrationConfig

common_config

通用的量化配置，若某层未被override_layer_types或者override_layer_configs重写，则使用该配置。

repeated

OverrideLayerType

override_layer_types

重写某一类型层的量化配置。

repeated

OverrideLayer

override_layer_configs

重写某一层的量化配置。

optional

bool

do_fusion

是否开启bn融合功能，默认为true，表示开启该功能。

repeated

string

skip_fusion_layers

跳过bn融合的层，配置之后这些层不会进行bn融合。

OverrideLayerType

required

string

layer_type

支持量化的层类型的名字。

required

CalibrationConfig

calibration_config

重置的量化配置。

OverrideLayer

重置某层量化配置。

required

string

layer_name

被重置层的层名。

required

CalibrationConfig

calibration_config

重置的量化配置。

CalibrationConfig

Calibration量化的配置。

ARQuantize

arq_quantize

权重量化算法配置。

arq_quantize：ARQ量化算法配置。

FMRQuantize

ifmr_quantize

数据量化算法配置。

ifmr_quantize：IFMR量化算法配置。

ARQuantize

ARQ量化算法配置。

optional

bool

channel_wise

是否对每个channel采用不同的量化因子。

FMRQuantize

FMR量化算法配置。

optional

float

search_range_start

量化因子搜索范围左边界。

optional

float

search_range_end

量化因子搜索范围右边界。

optional

float

search_step

量化因子搜索步长。

optional

float

max_percentile

最大值搜索位置。

optional

float

min_percentile

最小值搜索位置。

基于该文件生成的简易量化配置文件quant.cfg样例如下所示：# global quantize parameter

batch_num : 2

activation_offset : true

skip_layers : "conv_1"

skip_layer_types:"Conv2D"

do_fusion: true

skip_fusion_layers : "conv_1"

common_config : {

arq_quantize : {

channel_wise : true

}

ifmr_quantize : {

search_range_start : 0.7

search_range_end : 1.3

search_step : 0.01

max_percentile : 0.999999

min_percentile : 0.999999

}

override_layer_types : {

layer_type : "MatMul"

calibration_config : {

arq_quantize : {

channel_wise : false

}

ifmr_quantize : {

search_range_start : 0.8

search_range_end : 1.2

search_step : 0.02

max_percentile : 0.999999

min_percentile : 0.999999

}

override_layer_configs : {

layer_name : "conv_2"

calibration_config : {

arq_quantize : {

channel_wise : true

}

ifmr_quantize : {

search_range_start : 0.8

search_range_end : 1.2

search_step : 0.02

max_percentile : 0.999999

min_percentile : 0.999999

}

余楚客

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
tensorflow 模型小型化_简易量化配置文件说明_昇腾CANN（20.1）_推理场景_开发辅助工具指南_模型小型化工具使用指南（TensorFlow）_附录_华为云...

calibration_config.proto文件参数说明如表1所示。表1calibration_config.proto参数说明消息是否必填类型字段说明AMCTConfig---模型小型化工具的简易量化配置。optionaluint32batch_num量化使用的batch数量。optionalboolactivation_offset数据量化是否带offset。repeatedstrings...
复制链接

扫一扫