- 博客(13)
- 收藏
- 关注
原创 论文学习——MGPUSim:实现多GPU性能建模和优化
MGPUSim:实现多GPU性能建模和优化提出一种并行的多GPU架构仿真器,能提供高保真性、高灵活性和高性能。
2024-03-09 13:29:28
1158
1
原创 NVIDIA DGX SuperPOD架构学习
NVIDIA DGX A100系统是面向人工智能工作负载的通用系统,在全球首个5千万亿次浮点运算每秒人工智能系统中提供了前所未有的计算密度、性能和灵活性。为了建立一个灵活的系统,能够大规模地运行大量的DL应用程序,组织需要一个平衡的系统,该系统至少包括结构特点要求:计算结构必须能够从数百个节点扩展到数千个节点,同时最大限度地提高DL通信模式的性能。Full fat-tree网络(每个DGX A100系统有8个连接)要求:存储结构必须为共享存储提供高吞吐量的访问。
2024-02-28 19:49:48
1218
1
原创 利用gem5全系统模式测试garnet系统性能的完整流程(包含checkpoint的使用方法)
利用gem5全系统模式测试garnet系统性能的完整流程,以及checkpoint的使用方法
2023-05-25 09:35:09
1451
4
原创 在gem5中利用garnet3.0配置chiplet互连系统
对gem5_chips的配置(garnet2.0)和扩展(garnet3.0)
2023-04-04 14:12:13
1783
2
原创 gem5学习——Garnet合成流量(Synthetic Traffic)
本文是对gem5官方教程gem5: Garnet Synthetic Traffic 的学习记录
2023-03-16 09:25:19
483
原创 gem5学习——HeteroGarnet:对多样互连系统的详细模拟器
本文是对gem5官方教程gem5: HeteroGarnet (Garnet 3.0) 的学习记录(能够精确模拟新兴互连系统)
2023-03-16 08:16:03
1018
原创 gem5学习——Ruby
本文是对gem5官方教程gem5: Ruby的学习记录。Ruby实现了一个更细节的内存子系统的模拟模型。它建模了inclusive/exclusive cache,包含多种替换策略、一致性协议、互连网络、DMA和内存控制器,以及多种用于初始化内存请求和处理响应的排序器。
2023-03-15 20:40:46
1097
1
原创 gem5学习——The gem5 Memory System
本文是对gem5官方教程gem5: gem5_memory_syste 的学习:描述了gem5中的内存子系统,重点关注CPU简单内存事务(读或写)期间的程序流。
2023-03-15 13:25:47
952
3
原创 电脑无法进入BIOS界面的解决办法
(若电脑有独立显卡,而显示屏接在内置显卡接口处时,则会出现以上现象,显示屏仅显示进入window系统后界面)在电脑开机时使用快捷键无法进入BIOS界面,现象为。,那么可以检查电脑是否有独立显卡,检查显示屏是否接在独立显卡的接口上。
2023-03-10 13:46:22
5132
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人