gpu模拟器
gpu模拟器
黯止依蓝
这个作者很懒,什么都没留下…
展开
-
GPU模拟器地址
512KB~1024KB:Local Memory地址空间,属于独立thread,19位。1MB~256GB:Global Mempry地址空间,属于独立grid,38位。0~128KB:sharememory,属于每个block。2^9*2^10B,一个B一个地址,所以有2^19个地址。128KB~512KB:无效地址空间。地址计算方式,如512KB大小。原创 2024-04-08 11:33:36 · 100 阅读 · 0 评论 -
关于gpu模拟器任务发布
关于block如何分成warp,发现是blocksize来拆,blocksize是一个block所需要的总的线程数字,也就是说,这里是依赖所需要跑的warp总数来发布任务。然后这部分嵌套在csr指令里面,也就是读特殊的csr,会去执行getthreadid的操作,然后把threadid放到变量里。这里的warp就多一个block的信息,相当于warp是直到自己属于哪个block。那么发布任务,就每次增长block的size,如下。所以这里算的是线程在block里面的坐标位置。那我们看看warp有什么信息。原创 2024-04-09 14:03:19 · 132 阅读 · 0 评论 -
gpu模拟器初始化
CU初始化:初始化pu,block槽建立好,share memory建立好,warpmanager建立好,mmucu建立好。MachineGPU初始化:初始化mmuGpu,然后创建好CU,创建好threadblock调度器。GpuContext初始化:注册指令和创建MachineGPU。PU初始化:warp槽建立好。原创 2024-03-19 11:36:28 · 341 阅读 · 0 评论 -
gpu模拟器内存使用
先看walk函数,参数前两个分别是根页表的起始地址和这次要分配的虚拟地址的起始,因为映射也是需要分配物理页表的,所以这里可以看到如果是没有分配的,我们会分配一个物理页表,然后把它映射到表上。这里就是要把最后一集的页表项和物理地址关联起来,64位地址,由于物理页是按照4096来划分的,就是2^12次方,所以物理页一页的起始地址总是低位为12个0,所以变成页表项目就需要右移12位然后左移10位,低10位是标志之类的。传入参数是根页表,起始地址,大小,以及申请的物理页总和的起始地址。比如一开始的显存拷贝。原创 2024-04-08 16:32:48 · 295 阅读 · 0 评论 -
gpu模拟器总体流程
3、划分形状,传入内核函数,形状参数和设备端数据地址、执行计算。2、创建页表,开设备端空间并复制数据。4、复制数据回主机端,释放gpu资源。这里显存就是运行模拟器的机器。1、开显存空间,初始化。原创 2024-04-09 14:44:23 · 241 阅读 · 0 评论 -
gpu模拟器参数传入
只看执行部分,就是就绪的pu不断循环,我们先忽略线程同步的问题,那么当一个warp正常走完以后,那么他所属的block完成的warp数量+1,空出一个warp槽位,如果这时候block完成的warp和一开始发放的warp一致,那么导致block完成,那么grid所完成的block+1,然后我们重置该线程块。循环逻辑如下,首先循环所有pu,然后发现都不是合法的(因为一开始还没有分配任务),然后运行threadblock调度,找到一个可用的cu,然后分配block给这个cu。对于warp槽,是硬件资源。原创 2024-03-21 11:12:57 · 151 阅读 · 0 评论 -
gpu线程分支
因为和A之前的cbj指令是相对应的,所以会找到A指令之前的cbj存的a、w码,那么合并之后发现a、w码并不相等,那么说明还有分支没有执行,那么改变w码为0001,从栈里弹出B的pc+4以及掩码1110。E执行完成之后,遇到cbs,那么这是A的,A现在的信息为1111 0001合并a码之后为1111,和w码一样,说明合并完毕,然后所有线程继续往下执行。当D执行完毕之后,改变B的W码为1110,发现等于B的a码1110,说明B的所有分支重聚,那么当前a码改为1110,然后继续执行D的下一条指令。原创 2024-04-10 14:55:04 · 234 阅读 · 0 评论 -
gpu模拟器显存分配
所以用mmap申请一篇内存,大小是1024^3,一页大小是4096,所以我们一共有1024^3/4096 页。那么一共需要 1024^3/4096*sizeof(page)/4096+1页存储page项,所以显存的空间需要从起始地址加上给page分配的内存之后开始。然后剩余的页数就是总页数减去page用掉的页数。然后页表项也需要占用空间,类似这样。显存总大小是1024^3。原创 2024-03-25 18:24:50 · 155 阅读 · 0 评论