DNN硬件加速器设计2 -- Survey of DNN Development Resouces and DNN Hardware（MIT）_survey of accelator architecture for dnn-CSDN博客

本文链接：https://blog.csdn.net/archar_saber/article/details/123897066

本文概述了从LeNet到ResNet的发展历程，包括关键网络结构和创新点，如AlexNet的ReLU和Dropout，OverFeat的多任务融合，以及VGG-16和GoogLeNet的深度和模块化设计。同时，深入介绍了DNN硬件加速平台的CPU、GPU、ASIC和FPGA的优势与局限。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

2.1 Survey of DNN Development Resources

这里介绍一些基本的神经网络结构。它们是:在1998年提出的LeNet, 在2012年提出的AlexNet, 在2013年提出的OverFeat, 在2014年提出的VGGNet 和 GoogleNet, 在2015年提出的 ResNet。

（1） LeNet-5 -- 卷积神经网络的开山之作

图 1 LeNet-5

图1所示为LeNet-5的网络结构图，LeNet-5应用于数字图像识别。整个网络包含2层卷积运算层，3层全连接运算层，2层池化运算层。网络的权值参数占用存储大小为431K, 乘加操作（MAC）次数为2.3M.这样的小网络，很适合用于硬件加速设计来练手用。

（2）AlexNet

图 2 AlexNet

图2所示为AlexNet的网络结构图，相比于LeNet-5, 在AlexNet中，将Sigmod激活函数替换成了ReLU激活函数。使用ReLU激活函数不仅在计算方面比Sigmod更简单，而且可以克服Sigmoid激活函数在值接近于0或1时，出现的难以训练的问题。同时，AlexNet引入了Dropout方式用于解决在模型训练过程中容易出现过拟合的问题。

整个AlexNet网络由5层卷积运算层，3层最大值池化运算层，3层全连接运算层组成，网络权值参数的存储大小为61M，乘加操作(MAC)次数为724M.

这里值得一提的是，AlexNet中的归一化层(Normalization Layer)的类型就是Local Response Normalization(LRN)

表 1

表1所示为AlexNet网络中5层卷积运算层的相关配置参数信息。

（3）OverFeat(fast model)

表 2

OverFeat是早期经典的one-stage object Detection的网络算法。基于AlexNet网络，实现了识别，定位，检测共用同一个网络结构，获得了2013年ILSVRC定位比赛的冠军。OverFeat网络的主要创新点是multiscale, sliding window, offset pooling, 以及基于AlexNet的识别，定位和检测方法的融合。OverFeat网络由5层卷积运算层，3层全连接运算层，3层最大值池化运算层组成，其权值参数存储大小为144M，乘加操作数(MAC)为5.4G.

（4）VGG-16

图 3 VGG16

图3所示为VGG-16的网络结构，相比之前介绍的网络结构，直观的感受就是网络的层数更多了。VGG-16网络中由16层卷积运算层，3层全连接运算层，其权值参数存储大小为138M，乘加操作(MAC)次数为15.5G.在VGG-16中值得注意的结构特点是：VGG-16网络中的各个卷积运算层的卷积核的大小都是3x3的，因此，设计针对VGG-16的硬件加速器，其基本算子（PE）可以实现为3x3大小的DSP阵列，然后将多个PE组成大的处理阵列即可，不用考虑卷积核的大小变化，也很适合用于硬件加速器设计练手。

（5）GoogLeNet(v1)

图 4 Inception module

GoogleNet(v1)网络具有21层卷积运算层，1层全连接运算层，其权值参数的存储大小为7.0M，乘加操作(MAC)数为1.43G. GoogleNet网络的创新点是引入了如图4所示的Inception module的结构，将多个卷积运算结果concate在一起后，得到新的的特征图，用于下一阶段的数据输入。从硬件设计角度看，需要将多个运算过程独立出来，concate操作使用数据重排序来实现。

（6）ResNet-50

图 5 残差

ResNet-50具有49层卷积运算层，1层全连接运算层，其权值参数存储大小为25.5M，乘加操作（MAC）数为3.9G. ResNet-50中引入了如图5所示的残差计算结构。随着网络的加深，出现了训练集准确率下降的现象，可以确定这不是由于Overfit过拟合造成的（过拟合的现象：训练集准确率应该很高）。针对这个问题提出了一种全新的网络结构，称为深度残差网络，允许网络尽可能的加深。残差指的是什么呢？其中ResNet提出了两种mapping:一种是identity mapping, 指的就是图中“弯的曲线”,数据 X，另一种residual mapping, 指的就是除了“弯的曲线”的部分，数据 F(x)，所以最后的输出是y = F(x) + X. identity mapping 顾名思义，指本身，也就是公式中的X，而residual mapping指的是“差”，也就是y - x, 所以残差指的就是F(x)的部分。

下表3所示为6种网络的具体相关评价参数：