Flexpoint: An Adaptive Numerical Format for Efficient Training of Deep Neural Networks:弯曲点：一种有效训练深度神

最新推荐文章于 2024-08-14 22:29:49 发布

土豆娃potato

最新推荐文章于 2024-08-14 22:29:49 发布

阅读量152

点赞数

分类专栏：模型量化论文文章标签：人工智能量化论文

本文链接：https://blog.csdn.net/m0_49234921/article/details/124596051

版权

模型量化论文专栏收录该内容

23 篇文章 11 订阅 ¥59.90 ¥99.00

订阅专栏

超级会员免费看

Flexpoint是一种针对深度神经网络训练的数值格式，它结合了定点和浮点算法的优点，通过动态调整的共享指数来减少溢出并最大化动态范围。Flexpoint在16位精度下训练AlexNet、ResNet和Wasserstein GAN时表现出与32位浮点相当的性能，无需调整模型超参数。Autoflex指数管理算法能够预测和防止溢出，确保训练稳定性。研究表明，Flexpoint对未来的硬件训练和推断具有潜力。

摘要由CSDN通过智能技术生成

2017.:Flexpoint: An Adaptive Numerical Format for Efficient Training of Deep Neural Networks:弯曲点：一种有效训练深度神经网络的自适应数值格式

Abstract
1 Introduction
2 Related Work
3 Flexpoint
3.4 Autoflex Initialization
4 Experimental Results
- 4.1 Convolutional Networks
- 4.2 Generative Adversarial Networks(生成对抗网络）
5 Discussion
6 Conclusion

Abstract

在这里插入图片描述

深度神经网络通常以32位浮点格式开发和训练。通过对深度学习优化的数值格式进行训练和推理，可以显著提高性能和能源效率。尽管近年来在有限精度推理方面取得了进展，但低比特宽度神经网络的训练仍然是一个具有挑战性的问题。在这里，我们提出了Flexpoint数据格式，旨在完全替代32位浮点格式训练和推断，旨在不经修改地支持现代深度网络拓扑。Flexpoint张量有一个可动态调整的共享指数，以最小化溢出并最大化可用的动态范围。我们通过训练AlexNet[1]、深度残差网络[2,3]和生成式对抗网络[4]来验证Flexpoint，使用neon深度学习框架实现的模拟器。我们演示了16位Flexpoint在训练所有三个模型时与32位浮点非常匹配，而不需要调整模型超参数。我们的结果表明，Flexpoint对于未来的硬件训练和推断来说是一种很有前途的数字格式。

1 Introduction

深度学习是一个快速发展的领域，在解决多个行业的许多关键数据驱动问题方面取得了最先进的性能。随着主要芯片制造商对用于深度学习的新型硬件架构的追求，未来几年将出现新的计算设备，这些设备优化了深度神经网络的训练和推理，性能越来越好，成本越来越低。

通常，深度学习研究是在CPU和/或GPU架构上进行的，这些架构提供本地的64位、32位或16位浮点数据格式和操作。通过更高效的数据格式，可以在硬件占用、功耗、速度和内存需求方面获得实质性的改进。这就需要专门针对深度学习需求的数字表示和操

了解本专栏

超级会员免费看

土豆娃potato

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Flexpoint: An Adaptive Numerical Format for Efficient Training of Deep Neural Networks:弯曲点：一种有效训练深度神

2017.:Flexpoint: An Adaptive Numerical Format for Efficient Training of Deep Neural Networks:弯曲点：一种有效训练深度神经网络的自适应数值格式Abstract1 Introduction2 Related Work3 Flexpoint3.1 The Flexpoint Data Format3.2 Exponent Management（指数管理）3.3 Exponent Management Algorithm（
复制链接

扫一扫