神经网络的加速

本文探讨了神经网络计算的加速方法,包括算法层面的稀疏性和量化技术。稀疏性通过仅处理非零元素来减少计算量,而量化则通过降低精度以提高计算速度。此外,还提到了减小张量尺寸、图层面和算子层面的优化技术,为实现高效神经网络计算提供思路。
摘要由CSDN通过智能技术生成

背景

目前神经网络应用在大多数的场景,包括计算机视觉(包括目标识别、检测),推荐系统,大型的科学计算等。神经网络的计算本质上是张量计算(tensor),因此为了加速神经网络的计算,我们就需要进行张量的加速计算。为了加速张量计算,我们需要软硬件协调。

张量计算有两个特征

  • 计算密集(compute-intensive)
  • 访存受限(memory-bound)

目前现存的一些技术

算法层面

稀疏性

所谓的稀疏,就是利用神经网络计算过程中的零值元素。提出的要求就是只取出非零数值送到PE中,然后进行运算。包括的方面:从稀疏性的表示方式中编解码非零数值;访存的方式;回填机制。神经网络的稀疏性具体解释
free993-神经网络稀疏性来源

量化

神经网络的参数一般是以浮点数保存的,相比较整型,浮点数的计算需要更多的时钟周期,因此采用一些量化的方式的方式加速计算。
包括两种

  • precision lowering:将参数(weights,
    activations, gradients, weight updates
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值