ASIC芯片论文阅读
文章平均质量分 81
ASIC
happyday_gyx
这个作者很懒,什么都没留下…
展开
-
AI芯片论文:ASIC系列
目录索引页。论文一:指令集架构处理器Diannao论文二:服务器级处理器Dadiannao论文三:面向实时处理的视觉处理器Shidiannao论文四:稀疏处理器Cambricon-X论文五:Google TPUv1总结:AI芯片分类...原创 2021-02-04 15:51:14 · 527 阅读 · 0 评论 -
AI芯片:稀疏处理器Cambricon-X分析
Cambricon-X: An Accelerator for Sparse NeuralNetworks一、稀疏网络 我们以前提到的深度学习网络都属于稠密网络。经过研究发现,神经元间的连接很多都是冗余的,剪枝后反而有助于精度提升。目前网络的稀疏度可以达到90%以上,也就是说原来一个100MB参数的网络,压缩后,只有不到10MB的参数,大大减少了运算量。 对于加速器设计来说,剪枝后带来的一个问题是网络不规则性。如果不能较好的解决该问题,就不能从剪枝中获得理想收益。二、几种常用的压缩方法.原创 2021-02-01 14:15:06 · 1467 阅读 · 2 评论 -
AI芯片:Google TPU分析
In-Datacenter Performance Analysis of a Tensor Processing Unit TPU被设计为PCIe上的协处理器,可以像GPU一样插入到服务器中使用。一、TPU架构介绍 Weight FIFO:能容纳4个tile深的权重,主要负责从8GB的off-chip DRAM上读取权值;Unified buffer:24MiB大小的片上缓存单元。用于存储输入数据(DMA传输)和产生的中间结果;MMU:256 x 256 x 8bit的乘加单元。.原创 2021-01-31 12:24:45 · 2116 阅读 · 2 评论 -
AI芯片:面向实时处理的视觉处理器Shidiannao
ShiDianNao: Shifting Vision Processing Closer to the Sensor一、Diannao与Dadiannao 本文提出了一个视觉处理器,与传统的视觉处理装置不同。本文将处理单元Processor放在Sensor感知器附近,从而省略了DRAM的访存过程,我们对比一下传统和本文的视觉处理过程。传统视觉处理过程:Sensor采集->DRAM->Processor(SRAM)本文视觉处理过程:Sensor采集->Processor(S.原创 2021-01-29 18:49:40 · 935 阅读 · 0 评论 -
AI芯片:几种常见类型的AI芯片
引入 近些年来,深度学习网络不断兴起。数据运算量越来越大,对处理器并行处理能力要求越来越高。传统的通用处理器CPU受摩尔定律的影响,已经不能满足大规模的数据处理了。故而,专用AI处理器的设计再一次引起了人们的广泛关注。本文中,作者介绍几种常见类型的AI芯片。一、指令集架构的控制流处理器 这类处理器会为深度学习应用专门定义一类指令集,用指令集驱动的方式指引处理器的执行。指令集驱动的方式常见于通用处理器CPU的设计之中。2014年,寒武纪提出了Diannao[1]架构处理...原创 2021-01-28 18:42:36 · 2994 阅读 · 0 评论 -
AI芯片:服务器级处理器Dadiannao分析
DaDianNao: A Machine-Learning Supercomputer一、Diannao与Dadiannao Diannao和Dadiannao这两篇文章都发表于2014年。如果把Diannao看作是一个嵌入式终端处理器,那么Dadiannao就是服务器上使用的大规模高性能处理器。 以前听过龙芯CPU的发展方向,3A5000工艺提高主频,3C5000工艺增加核数。Diannao是在单核情况下对结构设计(主频)的探索,Dadiannao是对多核架构设计...原创 2021-01-26 20:41:13 · 1000 阅读 · 1 评论 -
AI芯片:指令集架构处理器Diannao分析
本文重在步骤过程上,对代码讲解较少。一、Overview本文首先利用高层次综合工具HLS实现一个矩阵乘IP核;再利用Vivado软件搭建一个系统;最后利用SDK编写驱动程序,在Zedboard上运行。...原创 2021-01-26 12:31:24 · 2254 阅读 · 2 评论