android object转实体类_Tensorflow模型量化4 --pb转tflite(uint8量化)小结-CSDN博客

Tensorflow模型量化4 --pb转tflite小结(uint8量化)

实验环境：tensorflow-gpu1.15+cuda10.0

模型的fp16量化和int8量化我之前有写，参考：

龟龟：Tensorflow模型量化实践2--量化自己训练的模型zhuanlan.zhihu.com

这次发现uint8量化时有参数设置，所以准备是从头再梳理一遍

2.参与量化的模型：

训练tensorflow-object-detection API 得到的ssdlite_mobilenet _v2模型，导出为frozen_inference_graph.pb

3.获取输入输出节点

进行frozen_inference_graph.pb模型解析，得到输入输出节点信息

代码入下：

"""
code by zzg
"""
import tensorflow as tf
import os
os.environ["CUDA_VISIBLE_DEVICES"] = "0"
config = tf.ConfigProto() 
config.gpu_options.allow_growth = True 
 
with tf.Session() as sess:
    with open('frozen_inference_graph_resnet.pb','rb') as f:
        graph_def = tf.GraphDef()
        graph_def.ParseFromString(f.read())
 
        tf.import_graph_def(graph_def, name='')
        tensor_name_list = [tensor.name for tensor in tf.get_default_graph().as_graph_def().node]
        for tensor_name in tensor_name_list:
             print(tensor_name,'n')

之后找到输入节点在预处理之后入下所示：

找到输出节点在后处理之前，如下图所示：

4.量化（pb->tflite）

4.1方法一：利用TFLiteConverter

'''

4.2方法二：利用TOCO

toco  --graph_def_file 
./frozen_inference_graph.pb 
--output_file test.tflite 
--input_format=TENSORFLOW_GRAPHDEF 
--output_format=TFLITE 
--inference_type=QUANTIZED_UINT8 
--input_shape='1,300,300,3' --input_array='FeatureExtractor/MobilenetV2/MobilenetV2/input' --output_array='concat,concat_1' 
--std_dev_value 127.5 
--mean_value 127.5
--default_ranges_min 0 
--default_ranges_max 255

补充重点：uint8量化时的参数设置

01.由于是进行uint8量化，所以输出范围为[0,255]

即default_ranges_min =0，default_ranges_max=255

02.std_dev_value和mean_value参数

参考：https://www.cnblogs.com/sdu20112013/p/11960552.html

结论:
训练时模型的输入tensor的值在不同范围时,对应的mean_values,std_dev_values分别如下：