2018：MIXED PRECISION TRAINING OF CONVOLUTIONAL NEURAL NETWORKS USING INTEGER OPERATIONS利用整数运算对卷积神经网络

土豆娃potato

已于 2022-05-06 14:39:20 修改

阅读量1k

点赞数

分类专栏：模型量化论文文章标签：深度学习神经网络计算机视觉

于 2022-05-05 21:41:30 首次发布

本文链接：https://blog.csdn.net/m0_49234921/article/details/124597219

版权

模型量化论文专栏收录该内容

23 篇文章 11 订阅 ¥59.90 ¥99.00

订阅专栏

超级会员免费看

该论文探讨了在ImageNet-1K数据集上使用整数运算进行混合精度训练的CNN，尤其是INT16-INT32 FMA操作。研究提出动态固定点格式，通过共享指数表示和有效的溢出管理策略，实现了与FP32相同或更好的精度。在ResNet-50等先进网络上，不仅达到了与单精度相当的精度，还提高了1.8倍的训练吞吐量。

摘要由CSDN通过智能技术生成

@[TOC](2018：MIXED PRECISION TRAINING OF CONVOLUTIONAL NEURAL NETWORKS USING INTEGER OPERATIONS(利用整数运算对卷积神经网络进行混合精度训练)论文阅读—未完待续！！！)

在这里插入图片描述

Abstract

用于混合精度训练的最先进的(SOTA)主要是各种低精度浮点运算，特别是FP16积累为FP32 Micikevicius等人(2017)。另一方面，虽然在低精度和混合精度Integer训练领域也发生了很多研究，但这些工作要么针对非sota网络(例如仅针对ImageNet-1K的AlexNet)，要么针对相对较小的数据集(如cipf -10)。在这项工作中，我们在ImageNet-1K数据集上训练最先进的视觉理解神经网络，并在通用(GP)硬件上使用Integer操作。特别地，我们关注整数融合乘加(FMA)操作，它接受两对INT16操作数并将结果累积为INT32输出。我们提出了张量的共享指数表示，并开发了一种适用于常见神经网络操作的动态不动点(DFP)方案。研究了开发高效整数卷积核的细微差别，包括处理INT32累加器溢出的方法。实现ResNet-50、GoogLeNet-v1、VGG-16、AlexNet的CNN训练;这些网络在与FP32相同的迭代次数内达到或超过SOTA精度，而超参数没有任何变化，端到端训练吞吐量提高了1.8倍。据我们所知，这些结果代表了第一个使用SOTA cnn的GP硬件ImageNet-1K数据集的INT16训练结果，并使用半精度表示实现了最高的报告精度。

了解本专栏

超级会员免费看

土豆娃potato

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
2018：MIXED PRECISION TRAINING OF CONVOLUTIONAL NEURAL NETWORKS USING INTEGER OPERATIONS利用整数运算对卷积神经网络

2018：MIXED PRECISION TRAINING OF CONVOLUTIONAL NEURAL NETWORKS USING INTEGER OPERATIONS论文阅读---未完待续！！！Abstract1 INTRODUCTION2 RELATED WORK3 THE DYNAMIC FIXED POINT FORMAT（动态定点格式）3.1 DFP TENSOR PRIMITIVES（dfp张量原语）4 NEURAL NETWORK TRAINING USING DYNAMIC FIXED
复制链接

扫一扫