tensorflow 模型小型化_简易量化配置文件说明_昇腾CANN(20.1)_推理场景_开发辅助工具指南_模型小型化工具使用指南(TensorFlow)_附录_华为云...

本文档详细介绍了TensorFlow模型小型化过程中calibration_config.proto文件的参数设置,包括批量数量、激活偏移、跳过层配置等。此外,还提供了ARQ和FMR量化算法的配置选项,以及如何通过全局和特定层配置来实现模型量化。
摘要由CSDN通过智能技术生成

calibration_config.proto文件参数说明如表1所示。

表1calibration_config.proto参数说明消息

是否必填

类型

字段

说明

AMCTConfig

-

-

-

模型小型化工具的简易量化配置。

optional

uint32

batch_num

量化使用的batch数量。

optional

bool

activation_offset

数据量化是否带offset。

repeated

string

skip_layers

不需要量化层的层名。

repeated

string

skip_layer_types

不需要量化的层类型。

optional

CalibrationConfig

common_config

通用的量化配置,若某层未被override_layer_types或者override_layer_configs重写,则使用该配置。

repeated

OverrideLayerType

override_layer_types

重写某一类型层的量化配置。

repeated

OverrideLayer

override_layer_configs

重写某一层的量化配置。

optional

bool

do_fusion

是否开启bn融合功能,默认为true,表示开启该功能。

repeated

string

skip_fusion_layers

跳过bn融合的层,配置之后这些层不会进行bn融合。

OverrideLayerType

required

string

layer_type

支持量化的层类型的名字。

required

CalibrationConfig

calibration_config

重置的量化配置。

OverrideLayer

-

-

-

重置某层量化配置。

required

string

layer_name

被重置层的层名。

required

CalibrationConfig

calibration_config

重置的量化配置。

CalibrationConfig

-

-

-

Calibration量化的配置。

-

ARQuantize

arq_quantize

权重量化算法配置。

arq_quantize:ARQ量化算法配置。

-

FMRQuantize

ifmr_quantize

数据量化算法配置。

ifmr_quantize:IFMR量化算法配置。

ARQuantize

-

-

-

ARQ量化算法配置。

optional

bool

channel_wise

是否对每个channel采用不同的量化因子。

FMRQuantize

-

-

-

FMR量化算法配置。

optional

float

search_range_start

量化因子搜索范围左边界。

optional

float

search_range_end

量化因子搜索范围右边界。

optional

float

search_step

量化因子搜索步长。

optional

float

max_percentile

最大值搜索位置。

optional

float

min_percentile

最小值搜索位置。

基于该文件生成的简易量化配置文件quant.cfg样例如下所示:# global quantize parameter

batch_num : 2

activation_offset : true

skip_layers : "conv_1"

skip_layer_types:"Conv2D"

do_fusion: true

skip_fusion_layers : "conv_1"

common_config : {

arq_quantize : {

channel_wise : true

}

ifmr_quantize : {

search_range_start : 0.7

search_range_end : 1.3

search_step : 0.01

max_percentile : 0.999999

min_percentile : 0.999999

}

}

override_layer_types : {

layer_type : "MatMul"

calibration_config : {

arq_quantize : {

channel_wise : false

}

ifmr_quantize : {

search_range_start : 0.8

search_range_end : 1.2

search_step : 0.02

max_percentile : 0.999999

min_percentile : 0.999999

}

}

}

override_layer_configs : {

layer_name : "conv_2"

calibration_config : {

arq_quantize : {

channel_wise : true

}

ifmr_quantize : {

search_range_start : 0.8

search_range_end : 1.2

search_step : 0.02

max_percentile : 0.999999

min_percentile : 0.999999

}

}

}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值