![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
芯片互联
文章平均质量分 72
tiaozhanzhe1900
FPGA
展开
-
文献阅读(216)Deflection Routing
A Support Vector Regression (SVR)-based Latency Model for Network-on-Chip(NoC) Architectures 2015 TCADAnalytical Performance Modeling of NoCs under Priority Arbitration and Bursty Traffic 2020 IEEE Embedded Systems LettersAnalytical Performance Models f原创 2024-06-25 00:21:55 · 202 阅读 · 0 评论 -
NoC流量控制
参考链接1:https://blog.csdn.net/yang1573/article/details/128787167参考链接2:https://shili2017.github.io/posts/NOC5/参考文件:SE22_noc_flow_control.pdf原创 2023-11-16 22:07:33 · 302 阅读 · 0 评论 -
文献阅读(207)FPGA HBM
FPGA中的HBM主要是为了解决带宽受限的问题,这里的两篇论文都是针对存储和互连的优化,希望能最大化HBM的带宽。原创 2023-10-23 21:32:18 · 571 阅读 · 0 评论 -
文献阅读(206)gem5-Aladdin Cohmeleon
本文介绍了gem5-aladdin,集成了gem5系统模拟器和aladdin加速器模拟器,能够模拟具有复杂加速器-系统交互的SOC。数据路径的并行性应该更低,与隔离设计的加速器相比,这可以实现更平衡的设计和更高的能效。其次,本地内存接口的选择高度依赖于动态内存加速工作负载的特征,系统架构以及所需的功耗/性能目标。对于专用硬件加速器,有的可以直接访问片外DRAM,有的会有自己的private cache,虽然不需要细粒度同步,但同样需要缓存一致性来保证数据确定正确性。原创 2023-05-26 10:26:52 · 243 阅读 · 0 评论 -
文献阅读(204)Big-Little
NoP采用Y-X路由方法,每个chiplet由一个本地DRAM(本工作中为DDR4)组成,其中存储了IMC交叉阵列所需的权重。大chiplet通过micro-bumps直接连接到基板上。基于bridge的NoP用于大chiplet的通信。针对存内计算,同构chiplet的硬件利用率不一定高,这是因为DNN中前面的网络层特征图多,后面的网络层权重多。原创 2023-04-23 19:18:54 · 117 阅读 · 0 评论 -
文献阅读(203)In-Network Cache Coherence
交换机是服务器间通信的集中枢纽,可用来处理缓存一致性,来减少服务器之间的通信。而且,交换机拥有片上内存,允许在交换机中存储缓存块元数据。此外,片上存储器可以支持原子读-修改-写操作,从而减轻同步冲突的一致性请求的努力。本篇论文是在可编程交换机中实现快速的in-network cache coherence,为了克服可编程交换机的局限性,我们还引入了两种技术。分布式共享内存(DSM)需要缓存一致性,但会导致更多的通信影响整体吞吐率,极端情况下,仅仅5%的写入率就会导致50%吞吐的降低。原创 2023-04-15 17:35:08 · 159 阅读 · 0 评论 -
文献阅读(201)topology-aware sparse allreduce
图(b)中,类似GPU的NVCLuster,节点包括4个CPU和8个GPU,排列在超立方体网格中,如图1(b)所示。因为每个V100 GPU具有6个NV link,所以通过允许两个NV link连接额外的主干环,即作为0-3-2-1-5-6-7-4的环,在GPU之间构建一对GPU。图(a)中,每个节点有2个Xeon Gold CPU和4个Tesla V100 GPUs。GPU之间的节点内网络是全连接网络拓扑,由50GBps的NVLink组成。在每次迭代中,使用数据集的不同部分独立计算前向和后向,原创 2023-03-25 15:47:05 · 344 阅读 · 0 评论 -
文献阅读(195)物理设计/时序分析
11原创 2022-12-10 22:00:34 · 300 阅读 · 0 评论 -
文献阅读(194)Multi-packet Bypassing
本篇论文的主要贡献:- 新的流控制算法FastFlow,用于在非重叠路径上无缓冲地路由- 通过promoting blocked packet来实现无死锁原创 2022-12-07 10:57:41 · 406 阅读 · 0 评论 -
文献阅读(192)光互连&存内计算互连架构
光互连&存内计算互连架构原创 2022-11-30 22:53:30 · 476 阅读 · 0 评论 -
文献阅读(190)Adapt NoC
本篇论文的主要贡献:1. 可重构NoC架构Adapt-NoC,为多个不相交subNoC提供2. 通过流量控制和路由,协同不同的子网拓扑,提升性能原创 2022-11-23 14:41:24 · 279 阅读 · 0 评论 -
文献阅读(189)Interposer
111原创 2022-11-23 10:51:52 · 332 阅读 · 0 评论 -
文献阅读(188) ORION
面积评估的方法可以分成parametric modeling基于参数的建模和nonparametric modeling非参数的建模,其中非参数模型直接基于P&R结果的样本集自动生成的估计模型,如SVM,径向基函数(radial basis functions)原创 2022-11-15 19:50:48 · 113 阅读 · 0 评论 -
文献阅读(185)Co-design
本篇论文的主要贡献:1. A unified tool flow that, for the first time, designs and optimizes chiplets and the package of high-density 2.5D systems together taking into account the mutual interactions between them; 2. A new holistic parasitic extraction and STA a....原创 2022-08-05 18:06:39 · 453 阅读 · 0 评论 -
内存子系统
一般来说,DRAM 是一个焊接在 PCB 上的独立芯片,而 PHY 与 MC 则是 FPGA 或者 ASIC 用户逻辑的一部分原创 2022-08-03 22:40:20 · 295 阅读 · 0 评论 -
文献阅读(183)MAGMA
- We utilized optimization-based mapper to solve the mapping problem, while prior arts focus on manually designing a mapper.- We target both homogeneous and heterogeneous DNN accelerator platforms. - We target a diverse spectrum of models across vision,原创 2022-08-02 10:54:57 · 226 阅读 · 0 评论 -
Arteris Training
ARTERIS原创 2022-07-13 22:00:43 · 1821 阅读 · 3 评论 -
文献阅读(180)NoC mapping
文章目录题目:GAMMA: Automating the HW Mapping of DNN Models on Accelerators via Genetic Algorithm时间:2022会议:ICCAD研究机构:GIT本篇论文的主要贡献: 针对DNN mapping定义了完整映射空间,通过遗传算法实现了DNN的自动mappingDNN加速器的架构可以分成两部分,硬件资源以及映射策略,其中本文的硬件资源主要是面向NoC互连的PE阵列,而硬件映射主要包含了tiling strategy原创 2022-04-05 01:27:59 · 573 阅读 · 0 评论 -
文献阅读(179)Layerweaver & PREMA
本篇论文的主要贡献: 针对多个DNN模型进行分时复用调度,来尽可能提高硬件计算与带宽的利用率。核心思路还是计算任务和通信任务的切分,以及不同网络之间的调度原创 2022-04-02 21:33:59 · 210 阅读 · 0 评论 -
文献阅读(178)chiplet成本
文章目录题目:Chiplet Actuary: A Quantitative Cost Model and Multi-Chiplet Architecture Exploration时间:2022会有:DAC研究机构:清华马恺声本篇论文的主要贡献: 针对chiplet成本的量化分析模型以及分析方法chiplet确实可以提高芯粒良率,但同时也会增加其他的成本,包括基板、D2D开销以及NRE成本,本篇论文便是首次分析了D2D的间接费用以及NRE成本良率模型:chiplet复用方式可以分为原创 2022-04-02 00:22:35 · 784 阅读 · 1 评论 -
文献阅读(176)waferscale chiplet
This work for the first time, attempts to build a fine-grained chiplet-based waferscale processor prototype原创 2022-03-25 12:26:27 · 363 阅读 · 0 评论 -
文献阅读(172)2021 NoC论文
针对虚通道Virtual Channle(VC)分配问题进行优化,将VC分配问题抽象成Traffic Conflict Graph图,并在VC mapping之后生成拓扑。原创 2022-03-03 22:18:19 · 456 阅读 · 0 评论 -
文献阅读(171)2022体系架构
本篇论文的主要贡献: 针对训练时量化的神经网络架构1. 训练时量化,使得训练精度几乎不降低2. 提出了一个加速单元完成sliced data的statistic-based量化3. 通过一个近存处理单元来减少权重数据的搬运原创 2022-02-11 10:03:29 · 70 阅读 · 0 评论 -
文献阅读(170)Chiplet规范
ODSA的目的是为chiplet建立开放的物理与逻辑D2D接口原创 2022-02-08 09:53:59 · 617 阅读 · 0 评论 -
文献阅读(168)强化学习 & Routerless NoC
文章目录题目:A Deep Reinforcement Learning Framework forvArchitectural Exploration: A Routerless NoC Case Study时间:2020会议:HPCA研究机构:南加大/俄勒冈州立大学本篇论文的主要贡献:Routerless NoC搜索空间巨大,本篇论文采用了强化学习+蒙特卡洛数数搜索,最后实现吞吐提高、延时降低、功耗降低一共有两种没有路由器的NoCisolated multi-ring(IMR):原创 2021-11-02 11:09:35 · 972 阅读 · 0 评论 -
文献阅读(167)NoC神经网络加速器
文章目录面向DNN的NoC拓扑比较题目:Energy-Efficient and High-Performance NoC Architecture and Mapping Solution for Deep Neural Networks时间:2019会议:NOCS研究机构:GIT本篇论文的主要贡献:针对DNN比较不同拓扑,提出CMesh NoC架构提出负载均衡映射与数学模型面向DNN的NoC拓扑比较Crossbar: 缺点是硬件的扩展性Ring: 优点是每个router只需原创 2021-10-25 20:39:29 · 1582 阅读 · 0 评论 -
文献阅读(166)鲲鹏
文章目录1 introduction2 互联设计题目:Kunpeng 920: The First 7-nm Chiplet-Based 64-Core ARM SoC for Cloud Services时间:2021期刊:IEEE MICRO研究机构:华为1 introduction鲲鹏920的设计目标:面向多个细分市场的出色可扩展性(例如。服务器和个人电脑);能效高,性能好;模具的可重用性。本篇论文的主要贡献:CPU内核设计,高效处理并行数据高速缓存一致性机制来应对e原创 2021-10-18 09:37:04 · 826 阅读 · 0 评论 -
文献阅读(165)chiplet路由
本篇论文的主要贡献:chiplet集成中提出了模块化的无死锁路由算法,使得每个chiplet可以独立的设计自己的NoC拓扑和局部路由算法,only requires a few selected turn restrictions at the “boundaries” between the chiplets and the interposer原创 2021-10-14 11:47:39 · 266 阅读 · 1 评论 -
文献阅读(156)异构集成
文章目录introduction1 introduction题目:A 256Gb/s/mm-shoreline AIB-Compatible 16nm FinFET CMOS Chiplet for 2.5D Integration with Stratix 10 FPGA on EMIB and Tiling on Silicon Interposer时间:2021会议:CICC研究机构:密西根大学introduction这篇论文有两个Multi-chip modules(MCM),一个是原创 2021-09-15 21:22:47 · 284 阅读 · 0 评论 -
文献阅读(160)chiplet设计空间探索
文章目录1 introduction2 方法题目:Design Space Exploration for Chiplet-Assembly-Based Processors时间:2020期刊:TVLSI研究机构:UCLA1 introduction本文的motivation源自作者提出的三个问题:用一组chiplet将用于构建一组针对不同应用的芯片时,应该如何设计?当每个芯片仅针对应用程序的一部分功能时,不同chiplet和相应芯片的微架构特征是什么?就设计和制造的总成本而言,基于原创 2021-09-12 23:08:52 · 1208 阅读 · 0 评论 -
文献阅读(163)CCASM
文章目录题目:CCASM: A Computation- and Communication-Aware Scheduling and Mapping Algorithm for NoC-Based DNN Accelerators时间:2021会议:ASICON研究机构:上海交大原创 2021-09-11 23:44:23 · 121 阅读 · 0 评论 -
文献阅读(159)AMD CPU
文章目录1 关键名词题目:Zeppelin: An SoC for Multichip Architectures时间:2018期刊:JSSC研究机构:AMD这篇论文介绍的是AMD ZEN1架构CPU,是最开始MCM,还有出现ZEN2的IO die参考链接与论文中的图片基本一致1 关键名词IF: infinity fabricSDF: scalable data fabricSCF: scalable control fabricA flexible, yet powe原创 2021-08-14 23:21:04 · 248 阅读 · 0 评论 -
文献阅读(158)3D堆叠
文章目录1 introduction1 introduction题目:A 4 × 4 × 2 Homogeneous Scalable 3D Network-on-Chip Circuit With 326 MFlit/s 0.66 pJ/b Robust and Fault Tolerant Asynchronous 3D Links时间:2017期刊:JSSC研究机构:法国CEA-LETI1 introductionIn this paper, we present a 3D modu原创 2021-08-13 10:29:03 · 259 阅读 · 0 评论 -
文献阅读(157)Chiplet
文章目录1 introduction1 introduction2 互联题目:INTACT: A 96-Core Processor With Six Chiplets 3D-Stacked on an Active Interposer With Distributed Interconnects and Integrated Power Management时间:2021期刊:JSSC研究机构:法国CEA-LETI1 introductionfirst CMOS active inter原创 2021-08-05 22:20:41 · 590 阅读 · 0 评论 -
文献阅读(151)
文章目录1 缩写 & 引用2 abstract & introduction3 前端设计方法3.1 背景题目:A Modular Digital VLSI Flow for High-Productivity SoC Design时间:2018会议:DAC研究机构:Brucek Khailany(英伟达)1 缩写 & 引用GALS: globally as...原创 2020-01-12 10:11:12 · 373 阅读 · 0 评论 -
文献阅读(155)(2020年10月之前NoC论文汇总)
本篇论文的主要贡献:1. 设计了FPGA fabric和NoC之间的灵活接口2. 依靠RTL2Booksim实现NoC和硬件RTL联合仿真3. 统计了NoC和bus对memory访问延时4. 以此设计了网络交换机,并分析了JPEG压缩中的延时原创 2020-11-30 08:41:17 · 707 阅读 · 0 评论 -
文献阅读(152)Eyeriss v2(未完)
文章目录1 缩写 & 引用2 abstract & introduction3 架构总览4 灵活的hierarchical mesh片上网络题目:Eyeriss v2: A Flexible Accelerator for Emerging Deep Neural Networks on Mobile Devices时间:2019期刊:IEEE Journal of Eme...原创 2020-01-12 10:11:51 · 1033 阅读 · 0 评论