论文解析
文章平均质量分 89
该专栏的博客主要分为作者介绍、摘要、正文、参考文献、评等章节,其中摘要、正文、参考文献均从原文摘抄或翻译,部分表述会基于原文重新组织,但基本均为客观描述,评章节为博主的主观评价。
KGback
一个ICer的搬砖生涯
展开
-
论文解析——Manticore: A 4096-core RISCV Chiplet Architecture for Ultra-efficient Floating-point Computing
Manticore:一个用于超高效浮点计算的4096个riscv核的chiplet架构原创 2024-04-01 15:47:36 · 875 阅读 · 0 评论 -
论文解析——Application Defined On-chip Networks for Heterogeneous Chiplets: An Implementation Perspective
应用定义片上网络的异构chiplet:实现前景。先进的2.5D和3D集成技术已经使得chiplet组合系统成为大芯片设计的一个替代,产业界的偏好是对chiplet系统最好的反应,领先的公司基于成本和可扩展的考虑已经在该领域采取行动。原创 2024-03-07 21:18:56 · 1032 阅读 · 0 评论 -
论文解析——Ascend: a Scalable and Unified Architecture for Ubiquitous Deep Neural Network Computing
昇腾:一种用于DNN计算的可扩展的统一架构原创 2024-03-01 11:54:54 · 839 阅读 · 0 评论 -
论文解析——Review of chiplet-based design: system architecture and interconnection
本文主要介绍了当前主要chiplet系统的分解方案及其优劣,对异构chiplets系统的互连拓扑做了详细分析,介绍了chiplets间的死锁原因和解锁策略,同时对不同chiplets系统的封装方案也做了辅助介绍,也特别强调了架构-封装设计的协同。整体来说,是一篇对chiplets架构设计做了全面论述的好文章。原创 2024-02-25 21:22:27 · 1088 阅读 · 0 评论 -
论文解析——In-DRAM Bulk Bitwise Execution Engine
很多应用都严重依赖逐位操作计算。在已有的系统中机型批量逐位操作需要处理器在内存通道上传输大量的数据,因此需要高延迟、内存带宽和能耗。在这篇文章中,我们介绍了Ambit,一种完全在主存中进行批量逐位操作(bulk bitwise operation)的机制,通过基于DRAM的内部的架构和模拟操作可以获得低成本、高性能和低功耗的效果。原创 2024-01-16 14:54:47 · 352 阅读 · 0 评论 -
论文解析——Debunking the 100X GPU vs. CPU Myth: An Evaluation of Throughput Computing on CPU and GPU
揭穿GPU相比于CPU 100倍性能的神话:一次CPU和GPU上的吞吐量计算的评估原创 2024-01-15 21:33:37 · 822 阅读 · 0 评论 -
论文解析——Kunpeng 920: The First 7-nm Chiplet-Based 64-Core ARM SoC for Cloud Services
鲲鹏920是海思基于ARM架构设计的第二代服务器处理器。利用大量的chiplets以及hybrid工艺技术,鲲鹏920在处理不同负载的同时获取截稿的成效。通过这些灵活的chiplet的重组可以构建新的设计。鲲鹏系列处理器混合各类技术来提升效率,消除瓶颈,提升价值和性能。其关键特征如下:支持向量扩展的超标量架构为高性能应用场景赋能;通过一致性cache子系统将多核基于超低延迟、非阻塞、bufferless的ring设计集成进单chiplet中;原创 2023-11-10 23:01:55 · 852 阅读 · 0 评论 -
论文解析——Implementing Precise Interrupts in Pipelined Processors
当一条指令执行结束另一条指令开始前,如果保存的进程状态和程序执行的顺序模型相关时,中断要求非常精确。在一个流水线处理器中,由于上一条指令已经完成,下一条指令也许会被初始化,因此中断的精确控制通常是很困难的。本文描述和评估了在流水线处理器中的对精确中断问题的解决方案。首先将描述精确中断问题,然后将详细描述第一个解决方案。第一个是强制指令按照架构顺序完成和修改处理器状态,其他的四种将允许指令以任意的序完成,但是将需要额外的硬件,以致于当中断发生时,精确的状态很难恢复。所有的方法将在并行流水下讨论。原创 2023-11-01 13:09:22 · 201 阅读 · 0 评论 -
论文解析——一种面向Chiplet互连的高效传输协议设计与实现
本位内容来源于论文一种面向Chiplet互连的高效传输协议设计与实现原创 2023-10-16 09:45:29 · 183 阅读 · 0 评论 -
论文解析——一种多核处理器直连接口QoS的设计与验证
本文内容来源于论文:一种多核处理器直连接口QoS的设计与验证原创 2023-10-15 15:33:23 · 142 阅读 · 0 评论 -
论文解析——Pioneering Chiplet Technology and Design for the AMD EPYC™ and Ryzen™ Processor Families
本文详细解释了推动AMD使用chiplet技术的挑战,产品开发的技术方案,以及如何将chiplet技术从单处理器扩展到多个产品系列。原创 2023-10-10 22:27:52 · 410 阅读 · 0 评论 -
论文解析——异构多芯粒神经网络加速器
论文解析——异构多芯粒神经网络加速器原创 2023-10-09 23:31:52 · 1683 阅读 · 0 评论