tensorflow量化感知训练_量化感知训练 | TensorFlow Model Optimization

最新推荐文章于 2024-06-22 22:14:57 发布

tomorrow-77

最新推荐文章于 2024-06-22 22:14:57 发布

阅读量650

点赞数

文章标签： tensorflow量化感知训练

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39946355/article/details/111513755

版权

本文介绍了TensorFlow中的量化感知训练，该技术能够在保持模型准确率的同时，模拟推理时间量化，从而减小模型大小，降低CPU延迟。通过实验，量化模型在ImageNet测试中展示了接近非量化模型的性能。API目前支持序贯和函数式模型，适用于TensorFlow 2.x Nightly版本，未来计划扩展到更多模型和硬件加速。

摘要由CSDN通过智能技术生成

由 TensorFlow Model Optimization 维护

有两种形式的量化：训练后量化和量化感知训练。请从训练后量化开始，因为它更易于使用，尽管量化感知训练在模型准确率方面的表现通常更好。

本页面概述了量化感知训练，旨在帮助您确定它与您的用例的契合程度。

要查看端到端示例，请参阅量化感知训练示例。

要快速找到您的用例所需的 API，请参阅量化感知训练综合指南。

概述

量化感知训练可以模拟推理时间量化，同时创建一个模型，下游工具将使用该模型生成实际量化模型。量化模型使用较低的精度(例如 8 位而不是 32 位浮点数)，这样可在部署期间带来诸多好处。

使用量化部署

量化通过压缩模型和减少延迟带来了诸多改进。使用 API 默认值时，模型大小可缩减至原来的四分之一，我们通常会在测试的后端中看到 CPU 延迟缩短为原来的三分之二到四分之一。最终，可以在兼容的机器学习加速器(例如 EdgeTPU 和 NNAPI)上看到延迟方面的改善。

这种技术用于语音、视觉、文本和翻译用例的生产中。代码目前支持其中一部分模型。

试验量化和相关硬件

用户可以配置量化参数(例如位数)，并在一定程度上配置底层算法。对 API 默认值进行这些更改后，将没有支持的部署路径。

特定于此配置的 API 是实验性的，不具备向后兼容性。

API 兼容性

用户可以使用以下 API 应用量化：

模型构建：仅包含序贯模型和函数式模型的 tf.keras。

TensorFlow 版本：TF 2.x Nightly 版本。

不支持包含 TF 2.X 软件包的 tf.compat.v1。</

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
tensorflow量化感知训练_量化感知训练 | TensorFlow Model Optimization

由 TensorFlow Model Optimization 维护有两种形式的量化：训练后量化和量化感知训练。请从训练后量化开始，因为它更易于使用，尽管量化感知训练在模型准确率方面的表现通常更好。本页面概述了量化感知训练，旨在帮助您确定它与您的用例的契合程度。要查看端到端示例，请参阅量化感知训练示例。要快速找到您的用例所需的 API，请参阅量化感知训练综合指南。概述量化感知训练可以模拟推理时间量...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。