基于FPGA的VGG16卷积神经网络加速器--WL

最新推荐文章于 2024-05-01 13:04:16 发布

Rehabilitation2018

最新推荐文章于 2024-05-01 13:04:16 发布

阅读量998

点赞数 1

文章标签： fpga开发 cnn 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/robot1701/article/details/123144998

版权

本文介绍了使用FPGA加速VGG16卷积神经网络的计算过程，通过并行运算提高卷积层效率。利用SoPC（ARM+FPGA）架构，数据存储在SDRAM中，卷积运算由FPGA硬件状态机控制，解决内存资源限制问题，通过循环输入处理大量权重数据。

摘要由CSDN通过智能技术生成

VGG16是一个典型的卷积神经网络，由13层卷积层，5层池化层和3层全连接层组成。且卷积层的计算时间在整个计算过程中占比极大，通过FPGA的并行运算可以有效的加快卷积层的计算速度。

在这里插入图片描述
一个卷积层可以有若干个卷积核，以第一层为例，该层对应的卷积核为64个3×3×3的卷积核，3×3是卷积核的尺寸，相当于将1个卷积核也按照RGB 分成3份(卷积核的通道数=输入图片的通道数)，对其进行卷积也就是乘加运算。

以尺寸为7×7的3通道图片与2个3×3的3通道卷积核为例
在这里插入图片描述
采用SoPC(ARM+FPGA)，通过C语言将数据放置在片外SDRAM中，并向硬件中的卷积状态机传输地址，通道数，卷积核数等参数和一个卷积使能信号。通过FPGA来进行卷积运算。

第一层的数据在SDRAM中的排列顺序如下：
在这里插入图片描述
硬件架构如下图，卷积状态机conv_state控制全部的计算过程，当PE单元完成1次计算并输出后，状态机控制DMA加载数据继续计算，直至全部完成。

最低0.47元/天解锁文章

Rehabilitation2018

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。