深度学习量化原理之-Python程序说明

papaofdoudou

已于 2022-06-12 20:26:20 修改

阅读量527

点赞数 7

分类专栏：人工智能算法数学文章标签：深度学习人工智能 python

于 2022-06-12 12:09:15 首次发布

本文链接：https://blog.csdn.net/tugouxp/article/details/125243850

版权

人工智能同时被 3 个专栏收录

156 篇文章 16 订阅

订阅专栏

数学

144 篇文章 19 订阅

订阅专栏

算法

104 篇文章 8 订阅

订阅专栏

关于量化原理的博客已经写了几篇

一文搞懂深度学习加速单元NPU的量化原理_papaofdoudou的博客-CSDN博客_npu原理

模型量化原理及tflite示例_papaofdoudou的博客-CSDN博客_模型量化原理

关于量化原理的思考_papaofdoudou的博客-CSDN博客

量化的数学原理_papaofdoudou的博客-CSDN博客_量化原理

本文则以一个程序来说明量化的具体计算过程：

import numpy as np

def quantization(x, s, z, alpha_q, beta_q):

    x_q = np.round(1 / s * x + z, decimals=0)
    x_q = np.clip(x_q, a_min=alpha_q, a_max=beta_q)

    return x_q

def quantization_int8(x, s, z):

    x_q = quantization(x, s, z, alpha_q=-128, beta_q=127)
    x_q = x_q.astype(np.int8)

    return x_q

def quantization_uint8(x, s, z):

    x_q = quantization(x, s, z, alpha_q=0, beta_q=255)
    x_q = x_q.astype(np.uint8)

    return x_q

def dequantization(x_q, s, z):

    x = s * (x_q - z)
    x = x.astype(np.float32)

    return x

def generate_quantization_constants(alpha, beta, alpha_q, beta_q):

    # Affine quantization mapping
    s = (beta - alpha) / (beta_q - alpha_q)
    z = int((beta * alpha_q - alpha * beta_q) / (beta - alpha))

    return s, z

def generate_quantization_int8_constants(alpha, beta):

    b = 8
    alpha_q = -2**(b - 1)
    beta_q = 2**(b - 1) - 1

    s, z = generate_quantization_constants(alpha=alpha,
                                           beta=beta,
                                           alpha_q=alpha_q,
                                           beta_q=beta_q)
    return s, z

def generate_quantization_uint8_constants(alpha, beta):

    b = 8
    alpha_q = 0
    beta_q = 2**(b) - 1

    s, z = generate_quantization_constants(alpha=alpha,
                                           beta=beta,
                                           alpha_q=alpha_q,
                                           beta_q=beta_q)

    return s, z

def relu(x, z_x, z_y, k):

    x = np.clip(x, a_min=z_x, a_max=None)
    y = z_y + k * (x - z_x)

    return y

def quantization_relu_uint8(x, s_x, z_x, s_y, z_y):

    y = relu(x=X_q, z_x=z_X, z_y=z_Y, k=s_X / s_Y)
    y = y.astype(np.uint8)

    return y

if __name__ == "__main__":

    # Set random seed for reproducibility
    random_seed = 0
    np.random.seed(random_seed)

    # Random matrices
    m = 2
    n = 4

    alpha_X = -60.0
    beta_X = 60.0
    s_X, z_X = generate_quantization_int8_constants(alpha=alpha_X, beta=beta_X)
    X = np.random.uniform(low=alpha_X, high=beta_X,
                          size=(m, n)).astype(np.float32)
    X_q = quantization_int8(x=X, s=s_X, z=z_X)

    alpha_Y = 0.0
    beta_Y = 200.0
    s_Y, z_Y = generate_quantization_uint8_constants(alpha=alpha_Y,
                                                     beta=beta_Y)
    Y_expected = relu(x=X, z_x=0, z_y=0, k=1)
    Y_q_expected = quantization_uint8(x=Y_expected, s=s_Y, z=z_Y)

    print("X:")
    print(X)
    print("X_q:")
    print(X_q)

    print("Expected Y:")
    print(Y_expected)
    print("Expected Y_q:")
    print(Y_q_expected)

    Y_q_simulated = quantization_relu_uint8(x=X,
                                            s_x=s_X,
                                            z_x=z_X,
                                            s_y=s_Y,
                                            z_y=z_Y)
    Y_simulated = dequantization(x_q=Y_q_simulated, s=s_Y, z=z_Y)

    print("Y from ReLU:")
    print(Y_simulated)
    print("Y_q from Quantized ReLU:")
    print(Y_q_simulated)

用python2执行上述程序：

结束！

papaofdoudou

关注

7
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
深度学习量化原理之-Python程序说明

关于量化原理的博客已经写了几篇一文搞懂深度学习加速单元NPU的量化原理_papaofdoudou的博客-CSDN博客_npu原理模型量化原理及tflite示例_papaofdoudou的博客-CSDN博客_模型量化原理关于量化原理的思考_papaofdoudou的博客-CSDN博客量化的数学原理_papaofdoudou的博客-CSDN博客_量化原理本文则以一个程序来说明量化的具体计算过程：用python2执行上述程序：......
复制链接

扫一扫