目录
报错2:ModuleNotFoundError: No module named 'jsonschema'
为什么选择 AIMET?
与 PyTorch 和 TensorFlow 模型配合使用。
支持高级量化技术:使用整数运行时进行推理比使用浮点运行时快得多。 例如,模型在 Qualcomm Hexagon DSP 上的运行速度比在 Qualcomm Kyro CPU 上快 5 到 15 倍。 此外,8 位精度模型的占用空间比 32 位精度模型小 4 倍。 然而,在量化 ML 模型时保持模型准确性通常具有挑战性。 AIMET 使用无数据量化等新技术解决了这个问题,这些技术在几个流行模型上提供了最先进的 INT8 结果。
支持先进的模型压缩技术,使模型在推理时运行得更快并需要更少的内存。
AIMET 旨在自动优化神经网络,避免耗时且繁琐的手动调整。 AIMET 还提供用户友好的 API,允许用户直接从他们的 TensorFlow 或 PyTorch 管道进行调用。
支持的功能
量化
跨层均衡:均衡权重张量以减少跨通道的幅度变化
偏差校正:校正由于量化而引入的层输出偏移
自适应舍入:学习给定未标记数据的最佳舍入
量化模拟:模拟目标量化推理精度
量化感知训练:使用量