tensorflow-模型训练后tflite量化（tensorflow1.15)

最新推荐文章于 2024-05-14 17:10:53 发布

哗啦呼啦嘿

最新推荐文章于 2024-05-14 17:10:53 发布

阅读量1.4k

点赞数 1

分类专栏： Tensorflow

本文链接：https://blog.csdn.net/weixin_40446557/article/details/115757547

版权

Tensorflow 专栏收录该内容

19 篇文章 1 订阅

订阅专栏

1.方式一： converter.post_training_quantize=True

def convert_model_qtv1():
    converter = tf.lite.TFLiteConverter.from_frozen_graph('model_convert/ckpt_new/densenet_ocr.pb', input_arrays=["Placeholder"],
                                                              input_shapes={"Placeholder": [1, 32, 280, 1]}, output_arrays=[
            "sequence_rnn_module/transpose_time_major"])
    converter.post_training_quantize=True
    tflite_model = converter.convert()
    open("model_convert/ckpt_new/densenet_ocr_metal_v1.tflite", "wb").write(tflite_model)

2.方式二：Dynamic range quantization

The simplest form of post-training quantization statically quantizes only the weights from floating point to integer, which has 8-bits of precision:

def convert_model_qtv1():
    converter = tf.lite.TFLiteConverter.from_frozen_graph('model_convert/ckpt_new/densenet_ocr.pb', input_arrays=["Placeholder"],
                                                              input_shapes={"Placeholder": [1, 32, 280, 1]}, output_arrays=[
            "sequence_rnn_module/transpose_time_major"])
    converter.optimizations = [tf.lite.Optimize.DEFAULT]
    tflite_model = converter.convert()
    open("model_convert/ckpt_new/densenet_ocr_metal-DY_v1.tflite", "wb").write(tflite_model)

3.方式三：Full integer quantization

Integer with float fallback (using default float input/output):

def representative_dataset():
    for _ in range(100):
      #这里一定记得要修改data的输入shape与模型的输入shape吻合
      data = np.random.rand(1, 32, 280, 1)
      yield [data.astype(np.float32)]

def convert_model_qtv1():
    converter = tf.lite.TFLiteConverter.from_frozen_graph('model_convert/ckpt_new/densenet_ocr.pb', input_arrays=["Placeholder"],
                                                              input_shapes={"Placeholder": [1, 32, 280, 1]}, output_arrays=[
            "sequence_rnn_module/transpose_time_major"])
    converter.optimizations = [tf.lite.Optimize.DEFAULT]
    converter.representative_dataset = representative_dataset
    tflite_model = converter.convert()
    open("model_convert/ckpt_new/densenet_ocr_metal-int_v1.tflite", "wb").write(tflite_model)

4.方式四：Float16 quantization

To enable float16 quantization of weights, use the following steps:

def convert_model_qtv1():
    converter = tf.lite.TFLiteConverter.from_frozen_graph('model_convert/ckpt_new/densenet_ocr.pb', input_arrays=["Placeholder"],
                                                              input_shapes={"Placeholder": [1, 32, 280, 1]}, output_arrays=[
            "sequence_rnn_module/transpose_time_major"])
    converter.optimizations = [tf.lite.Optimize.DEFAULT]
    converter.target_spec.supported_types = [tf.float16]
    tflite_model = converter.convert()
    open("model_convert/ckpt_new/densenet_ocr_metal-fl16_v1.tflite", "wb").write(tflite_model)

转换之后的tflite大小对比：

---没量化前

---方式一

---方式二

---方式三

---方式四

哗啦呼啦嘿

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
tensorflow-模型训练后tflite量化（tensorflow1.15)

1.方式一：converter.post_training_quantize=Truedef convert_model_qtv1(): converter = tf.lite.TFLiteConverter.from_frozen_graph('model_convert/ckpt_new/densenet_ocr.pb', input_arrays=["Placeholder"], ..
复制链接

扫一扫

专栏目录