基于脉动阵列实现矩阵卷积（FPGA)

最新推荐文章于 2024-07-03 07:52:40 发布

黄铠杰echo

最新推荐文章于 2024-07-03 07:52:40 发布

阅读量4.2k

点赞数 7

分类专栏： fpga 文章标签： fpga开发经验分享嵌入式硬件

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_50735735/article/details/124088326

版权

基于脉动阵列实现矩阵卷积（FPGA)

摸了很久🐟，才想起来还有一篇脉动阵列实现简单矩阵卷积的东西没写。今天就来通过google的tpu结构，来谈一下通过脉动阵列实现矩阵卷积，并且来写一个简单的3x3矩阵的2x2卷积核的卷积。

脉动阵列

脉动阵列的基本原理在之前的一篇已经写的很清楚了。可以翻到前面看一下脉动阵列的加速矩阵乘法的文章。这里就不赘述了。

脉动阵列实现矩阵卷积

其实这个概念已经是比较成熟了的东西了，谷歌的TPU架构让这个老东西回到大众视野里（虽然已经是18年的东西了），当时去年Google也出了一款tpu的芯片，还是值得期待一下的。

关于卷积大家应该很直观就能想象到下面这副图：

在这里插入图片描述

看动态图是比较简单的，但是实际上硬件执行卷积行为是需要花费额外的时钟周期和资源去做这件事情，不断进行乘加、累加操作，占用资源比较大。Google的工程师们想到可以通过脉动阵列来解决这个问题，使得数据重复读取的次数降低，让数据流动起来。

实现卷积阵列的原理，这里可以参考

最低0.47元/天解锁文章

关注

7
点赞
踩
46

收藏

觉得还不错? 一键收藏
3
评论
基于脉动阵列实现矩阵卷积（FPGA)

今天就来通过google的tpu结构，来谈一下通过脉动阵列实现矩阵卷积，并且来写一个简单的3x3矩阵的2x2卷积核的卷积。
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。