自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 智能计算系统 - chapter2 神经网络基础

根据训练数据有无标记(label)信息可以分为:无监督学习、监督学习。

2023-04-03 21:30:25 173

原创 CUDA C编程权威指南-chapter 3

CUDA架构是围绕一个流式多处理器的可扩展阵列搭建的。Fermi SM的关键组件:CUDA核心共享内存/一级缓存寄存器文件加载/存储单元特殊功能单元线程束调度器。每个SM都能支持数百个线程并发执行,每个GPU通常有多个SM,所以在一个GPU上并发执行数千个进程是有可能的。CUDA采用单指令多线程(SIMT)架构来管理和执行线程,每32个线程为一组,被称为。线程束中所有线程同时执行相同的指令。

2023-03-20 11:41:26 496

原创 CUDA C编程权威指南Chapter1&2

基于这些坐标,你可以将部分数据分配给不同的线程。全局类似于CPU的系统内存,而共享内存类似于CPU的缓存。然而GPU的共享内存可以由CUDA C的内核直接控制。构成,一个线程块包含一组线程,同一线程块内的线程协作可以通过同步和共享内存来实现。不同块内的线程不能协作。同一网格中的所有线程共享相同的全局内存空间。(线程格的维度,用每个线程格中的线程数来表示)(线程块的维度,用每个线程块中的线程数来表示)形式,一个线程块会被组织成线程的。一个线程格会被组织成线程块的。(线程块在线程格内的索引)

2023-03-13 19:15:56 737

原创 高性能计算-习题1

的子矩阵A与子矩阵B相加都能调用该子程序,用C或Fortran语言,比如,matradd(m,n,...,A,...,B,...,C)1.在主程序中定义了矩阵A和B(比如C语言,A[50][67],B[73][49]),请写一个通用子程序完成矩阵相加,使得对于任何。的方法并写出计算它的子程序。,用算法1写一个程序计算。

2023-03-06 11:40:33 141 2

原创 GPU高性能编程CUDA实战-第四章

...

2023-03-03 14:08:58 190

原创 设备环境初始化及激活进程0

task_struct:每个进程独有的结构,标识了进程的各项属性值,包括剩余时间片、进程执行状态、局部数据描述符表LDT和任务状态描述符表TSS。task[64]和GDT是为管理多进程提供的数据结构。task[64]中存储着系统中所有进程的task_struct指针,如果操作系统需要对多个进程加以比较并选择,可以通过遍历task[64]结构来实现。GDT中存储着一套针对所有进程的索引结构,通过索引项,操作系统可以间接地与每个进程中的LDT和TSS建立关系。DPL:特权级描述符IDT:中断描述符

2023-03-01 16:50:32 74

原创 MOSFET基本结构

MOSFET的基本结构以NMOS为例介绍MOSFET的基本结构,如下图所示,器件以p型硅为衬底,并扩散形成两个重参杂n+的区域,分别为源端(Source)和漏端(Drawn),应当注意的是,对于单个器件,源端和漏端是人为定义的,两者是对称可交换的。对于NMOS器件,源端一般接在电路的最低电位(接地),但对与PMOS源端一般接在最高电位(Vdd)。源漏之间的存在导电沟道,其理论长度为Ldrawn,但是由于在形成过程中的非理想因素的影响,导电沟道的长度会有一定程度的减小,也即Leff,两者之间的距离

2023-03-01 16:50:08 1168

原创 GPU高性能编程CUDA实战-第三章

在设备和主机之间复制数据,在GPU上执行的函数称为。CPU以及系统内存称为。,GPU及其内存称为。

2023-03-01 16:46:19 239

原创 从开机加电到执行main函数之前的过程

CPU收到int 0x19中断 ---> 在中断向量表找到int 0x19中断 ---> 中断向量把CPU指向0x0E6F2,即int 0x19对应的中断服务程序(即启动加载服务程序,这个中断服务程序的作用是把软盘第一扇区中的程序512B加载到内存0x07C00处) ---> 第一扇区的内容就是bootsect,作用是把软盘中的操作系统程序载入内存。IP/EIP:指令指针寄存器,存在于CPU中,记录将要执行的指令在代码段内的偏移地址,和CS组合为将要执行的指令的内存地址。head程序在前,内核程序在后。

2022-11-09 21:03:44 354

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除