自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 学习笔记——PCIe

上图是一个采用NUMA架构的PCIe计算机硬件系统结构。为了方便理解,CPU的结构是基于Intel的Sky Lake架构抽象得到,主要表达CPU内部各个硬件电路的关系,并非硬件实际电路结构。GPU为PCIe版GPU,并且两个NUMA节点下的GPU使用的是NvLink桥接器进行直接连接。此外,假设操作系统为Linux 64位操作系统在这样一个计算机系统中,总共有三个地址空间:虚拟地址空间,物理地址空间,PCIe总线地址空间

2024-05-15 21:42:04 1303 2

原创 MSCCL:如何运行自定义集合通信算法

使用MSCCL需要输入自定义的集合通信算法,自定义的算法需要以MSCCL规定的表示存在XML文件里,也就是MSCCL_XML_FILES环境变量指定的XML文件。 也就是说,如果想自己设置集合通信算法,并在GPUs上运行,总共分为以下几步: ① 克隆MSCCL到本地,然后按照GitHub上给的指南进行编译 ② 按照MSCCL规定的格式撰写XML文件 ③ 设置MSCCL_XML_FILES环境变量为XML文件所在的路径,并且设置NCCL_

2024-04-19 21:06:44 632 4

原创 学习笔记——GPU

本文为学习笔记,故只对知识点依据自己的理解作概要总结,方便以后复习激活记忆。内容主要包括:GPU硬件结构和GPU通信方式注:本文中GPU的讲解以A100型号为例,V100跟A100的架构差别不大也可适用,但是其他架构可能会有所出入。

2023-10-28 21:05:56 1223 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除