瑞芯微 rk3588 / rk356x 的rknn-toolkit2 / rknn2混合量化模型

gggi520

已于 2024-02-21 23:19:46 修改

阅读量2.8k

点赞数

分类专栏： rk嵌入式文章标签：人工智能嵌入式硬件神经网络

于 2022-11-09 21:33:22 首次发布

本文链接：https://blog.csdn.net/gggi520/article/details/127778295

版权

rk嵌入式专栏收录该内容

3 篇文章 2 订阅

订阅专栏

当网络模型全部int8量化或者uint8量化时效果不好时，可以使用rknn-toolkit2对模型进行混合量化，但是官方给的文档写的太模糊了，所以这里补充一些tip
1.在python step1.py后会生成几个文件，其中一个为xxx.cfg，主要用来修改混合精度的，以rk3588为例（rk3588支持float16 ，rk356x支持float32），custom_quantize_layers就是修改混合精度的地方，比如要改这3层为混合量化，修改的结果见图2
在这里插入图片描述

rknn1 混合量化

%YAML 1.2
---
# add layer name and corresponding quantized_dtype to customized_quantize_layers, e.g conv2_3: float32
customized_quantize_layers:
    attach_Conv_Conv_266/out0_0: dynamic_fixed_point-i16
    attach_Sigmoid_Sigmoid_294/out0_1: dynamic_fixed_point-i16
    Conv_Conv_279_14: dynamic_fixed_point-i16
    
quantize_parameters:
    '@attach_Conv_Conv_266/out0_0:out0':
        dtype: asymmetric_affine
        method: layer
        max_value:
        -   3.7605557441711426
        min_value:
        -   -0.7775306701660156
        zero_point:
        -   44
        scale:
        -   0.017796417698264122
        qtype: u8
    '@attach_Sigmoid_Sigmoid_294/out0_1:out0':
        dtype: asymmetric_affine
        method: layer
        max_value:
        -   0.27661600708961487
        min_value:
        -   0.0
        zero_point:
        -   0
        scale:
        -   0.0010847686789929867
        qtype: u8
    '@attach_Sigmoid_Sigmoid_295/out0_2:out0':
        dtype: asymmetric_affine
        method: layer
        max_value:
        -   0.5018787384033203
        min_value:
        -   0.0
        zero_point:
        -   0
        scale:
        -   0.0019681518897414207
        qtype: u8