硬件加速
页页读
这个作者很懒,什么都没留下…
展开
-
Verilog 实现卷积代码分析
代码阅读笔记code sourcem_conv_1_1 卷积部分m_conv_1_1~m_conv_1_18内容都是相同的,计算也是一样的,只是卷积核的值不同。基本思想是利用移位寄存器实现pipeline模式计算乘加运算。具体来说,先从rom中取出图片,大小为9696.串行送入864个shift寄存器,这里取卷积核大小为9x9,所以864就是9行的所有像素点数目。然后,从shift寄存器输入乘法寄存器,使用99个乘法寄存器来存储和卷积核相乘的所有像素值,该过程一共需要9个clk,开始从每行的.原创 2020-05-31 19:01:13 · 8275 阅读 · 1 评论 -
华为Atlas 200 DK 部署过程
博客一:https://blog.csdn.net/AMDS123/article/details/103180840?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-taskcode:https://gitee.com/Atlas200DK/sampl...转载 2020-04-01 12:33:19 · 1358 阅读 · 0 评论