使用指导 Quantization function tensor_quant 和 fake_tensor_quant 是量化张量的两个基本函数。 fake_tensor_quant 返回伪量化张量(浮点值)。 tensor_quant 返回量化张量(整数值)和比例。 tensor_quant(inputs, amax, num_bits=8, output_dtype=torch.float, unsigned=False) fake_tensor_quant(inputs, amax