基于FPGA的神经网络加速器设计
文章平均质量分 95
FPGA硅农
数字IC设计,FPGA开发
展开
-
基于FPGA的Yolov4 tiny目标检测网络加速器
简介之前实现了基于FPGA的Winograd CNN加速器(VGG16)和基于FPGA的MobileNet v2加速器,但这两个算法在本质上区别不大:一个是VGG16,另一个是轻量级的MobileNet v2,所实现的功能都是图像分类。因此,为了尝试更多的应用,本文在FPGA上实现了一个目标检测网络----Yolov4 tiny。yolo4 tiny的结构是YOLOv4的精简版,属于轻量化模型,参数只有600万相当于原来的十分之一,这类网络不仅能实现对图像的分类任务,还可以找出目标的位置,因此,更加贴近实原创 2022-02-27 16:47:54 · 28089 阅读 · 66 评论 -
基于FPGA的Winograd CNN加速器
Winograd算法winograd算法,它的本质就是通过减少卷积运算中的乘法,来减少计算量。我们以3x3,s=1的卷积为例,讲讲Winograd算法的具体流程。一个r×sr\times sr×s的卷积核,和一个输入特征图进行卷积运算,得到m×nm\times nm×n的输出,我们记为:F(m×n,r×s)F(m\times n,r\times s)F(m×n,r×s)其计算量为μ(F(m×n,r×s))=(m+r−1)∗(n+s−1)\mu (F(m\times n,r\times s))=(m原创 2021-11-24 10:34:11 · 6119 阅读 · 2 评论 -
基于FPGA的MobileNet V2卷积神经网络加速器
MobileNet V2介绍MobileNetV2是在V1基础之上的改进。V1主要思想就是深度可分离卷积。而V2则在V1的基础上,引入了Linear Bottleneck 和 Inverted Residuals。下图是MobileNet V2中的一个基本模块可以看到,该模块由三个卷积组成,第一第三个卷积是标准的1x1卷积,起到升维和降维的作用,而中间的是一个depthwise卷积,每一个卷积层之后,都紧接着一个BN层,以加速网络的收敛。同时,我们观察到,该模块的输入和输出有一个残差连接,即输入和最原创 2021-09-08 21:15:58 · 10176 阅读 · 30 评论 -
基于FPGA的VGG16卷积神经网络加速器
VGG在2014年由牛津大学Visual GeometryGroup提出,获得该年lmageNet竞赛中Localization Task(定位任务)第一名和 Classification Task (分类任务)第二名。与AlexNet相比,VGG使用了3个3x3卷积核来代替7x7卷积核,使用了2个3x3卷积核来代替5x5卷积核,从而在保证具有相同感知野的条件下,提升了网络的深度,在一定程度上提升了神经网络的效果。原创 2023-05-12 10:21:25 · 4569 阅读 · 1 评论