- 博客(9)
- 收藏
- 关注
原创 CUDA C编程权威指南-chapter 3
CUDA架构是围绕一个流式多处理器的可扩展阵列搭建的。Fermi SM的关键组件:CUDA核心共享内存/一级缓存寄存器文件加载/存储单元特殊功能单元线程束调度器。每个SM都能支持数百个线程并发执行,每个GPU通常有多个SM,所以在一个GPU上并发执行数千个进程是有可能的。CUDA采用单指令多线程(SIMT)架构来管理和执行线程,每32个线程为一组,被称为。线程束中所有线程同时执行相同的指令。
2023-03-20 11:41:26 590
原创 CUDA C编程权威指南Chapter1&2
基于这些坐标,你可以将部分数据分配给不同的线程。全局类似于CPU的系统内存,而共享内存类似于CPU的缓存。然而GPU的共享内存可以由CUDA C的内核直接控制。构成,一个线程块包含一组线程,同一线程块内的线程协作可以通过同步和共享内存来实现。不同块内的线程不能协作。同一网格中的所有线程共享相同的全局内存空间。(线程格的维度,用每个线程格中的线程数来表示)(线程块的维度,用每个线程块中的线程数来表示)形式,一个线程块会被组织成线程的。一个线程格会被组织成线程块的。(线程块在线程格内的索引)
2023-03-13 19:15:56 815
原创 高性能计算-习题1
的子矩阵A与子矩阵B相加都能调用该子程序,用C或Fortran语言,比如,matradd(m,n,...,A,...,B,...,C)1.在主程序中定义了矩阵A和B(比如C语言,A[50][67],B[73][49]),请写一个通用子程序完成矩阵相加,使得对于任何。的方法并写出计算它的子程序。,用算法1写一个程序计算。
2023-03-06 11:40:33 185 2
原创 设备环境初始化及激活进程0
task_struct:每个进程独有的结构,标识了进程的各项属性值,包括剩余时间片、进程执行状态、局部数据描述符表LDT和任务状态描述符表TSS。task[64]和GDT是为管理多进程提供的数据结构。task[64]中存储着系统中所有进程的task_struct指针,如果操作系统需要对多个进程加以比较并选择,可以通过遍历task[64]结构来实现。GDT中存储着一套针对所有进程的索引结构,通过索引项,操作系统可以间接地与每个进程中的LDT和TSS建立关系。DPL:特权级描述符IDT:中断描述符
2023-03-01 16:50:32 100
原创 MOSFET基本结构
MOSFET的基本结构以NMOS为例介绍MOSFET的基本结构,如下图所示,器件以p型硅为衬底,并扩散形成两个重参杂n+的区域,分别为源端(Source)和漏端(Drawn),应当注意的是,对于单个器件,源端和漏端是人为定义的,两者是对称可交换的。对于NMOS器件,源端一般接在电路的最低电位(接地),但对与PMOS源端一般接在最高电位(Vdd)。源漏之间的存在导电沟道,其理论长度为Ldrawn,但是由于在形成过程中的非理想因素的影响,导电沟道的长度会有一定程度的减小,也即Leff,两者之间的距离
2023-03-01 16:50:08 1499
原创 从开机加电到执行main函数之前的过程
CPU收到int 0x19中断 ---> 在中断向量表找到int 0x19中断 ---> 中断向量把CPU指向0x0E6F2,即int 0x19对应的中断服务程序(即启动加载服务程序,这个中断服务程序的作用是把软盘第一扇区中的程序512B加载到内存0x07C00处) ---> 第一扇区的内容就是bootsect,作用是把软盘中的操作系统程序载入内存。IP/EIP:指令指针寄存器,存在于CPU中,记录将要执行的指令在代码段内的偏移地址,和CS组合为将要执行的指令的内存地址。head程序在前,内核程序在后。
2022-11-09 21:03:44 402
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人